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数据 建 模 指 的 是 对 现实 世界 各 类 数据 的 抽象 组 织 ， 确 定数 据 库 需 
管辖 的 范围 、 数 据 的 组 织 形 式 等 直至 转化 成 现实 的 数据 库 。 而 数据 模 
征 构建 应 用 系统 的 核心 ， 是 尽 可 能 精准 地 表示 业务 运转 的 概念 性 杠 
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本 书 通过 平实 的 语言 ， 对 数据 模型 及 建 模 过 程 进行 了 深入 浅 出 的 
绍 。 全 书 内 容 分 为 5 个 部 分 ， 对 数据 建 模 简介、 数据 模型 要 素 ， 概 
念 、 人 逻辑 和 物理 数据 模型 、 数 据 模型 质量 以 及 数据 建 模 的 进 阶 内 容 等 
方面 进行 讲解 ， 全 面 细致 地 为 读者 解答 与 数据 建 模 相 关 的 知识 点 和 疑 
问 。 除 此 之 外 ， 本 书 的 最 后 还 对 各 类 专业 术语 进行 了 细致 的 解释 ， 方 
便 读者 参考 。 
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读者 以 及 从 事 数 据 科学 等 相关 工作 的 专业 人 士 参考 阅读 。 


对 本 书 的 赞誉 


对 本 书 的 赞誉 


Steve Hoberman 创 作 了 一 部 内 容 丰富 、 生 动 、 易 于 理解 、 实 践 性 
强 的 数据 建 模 著作 ， 而 对 于 任何 涉及 信息 技术 领域 的 专业 人 士 而 言 ， 
数据 建 模 无 疑 都 是 非常 重要 的 。Steve Hoberman 在 本 书 中 ， 清 楚 地 回 
答 了 什么 是 数据 建 模 、 为 什么 会 有 数据 建 模 ， 以 及 怎么 进行 数据 建 模 
等 天 键 问题 ， 并 且 通 过 适当 的 示例 、 类 比 和 练习 进一步 强化 了 涉及 的 
各 个 知识 点 。 


Len Silverston 


畅销 图 书 The Data Model Resource Book 〈 卷 1、 卷 2 和 卷 3) 的 作者 


数据 建 模 作为 有 待 探索 且 极 具有 潜在 价值 的 领域 ， 其 商业 价值 往 
往 隐 藏 于 某 个 组 织 的 信息 技术 部 门 。 本 书 既 强调 了 由 此 导致 的 商业 价 
值 的 损失 ， 也 提出 了 如 何 体现 其 价值 的 措施 。 在 “为 什么 "和 “如 何 ” 进 
行 数据 建 模 方 面 ， 给 出 了 一 个 易于 理解 和 详尽 的 指导 ， 同 时 也 提醒 我 
们 IT 项 目 开 发 的 成 功 策略 至 少 和 所 使 用 的 信息 技术 同样 重要 。 


— Chris Potts 


企业 IT 策略 师 及 畅销 图 书 Creating the Ultimate Corporate Strategy for 
Information Technology} (E44 


对 于 想 了 解数 据 建 模 的 初学 者 来 说 ， 本 书 无 疑 是 一 个 非常 好 的 参 
考 指 南 。Steve Hoberman 列 出 了 数据 建 模 的 基础 知识 ， 并 且 用 一 种 易 


于 理解 又 非常 有 趣 的 方式 表现 出 来 。 我 相信 每 位 读者 都 能 从 中 汲取 到 
自己 所 需 的 内 容 。 


David Marco 
EWSolutions 公 司 总 裁 


非常 好 的 一 本 书 ， 读 起 来 很 有 趣 。Steve 抓 住 了 数据 建 模 的 精华 并 
将 其 简化 ， 对 于 不 从 事 直接 数据 建 模 工 作 但 又 需要 参与 建 模 的 读者 而 
， 这 征 一 本 非常 好 的 入 门 指 南 。 对 于 偶尔 进行 数据 建 模 的 读者 来 
， 这 是 一 本 非常 有 价值 的 参考 书 。 对 于 具有 丰富 经 验 的 建 模 者 来 
， 这 本 书 会 时 刻 提醒 你 应 该 始终 保持 建 模 过 程 的 位 单 化 。 
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作为 一 名 数据 架构 师 和 数据 库 设 计 者 ， 我 购买 过 很 多 本 相关 的 
书 。 对 于 初学 数据 建 模 的 技术 人 员 和 业务 人 员 ， 本 书 是 一 个 非常 好 的 
工具 。Steve 用 目 己 的 方式 将 数据 建 模 的 复杂 性 和 基础 知识 进行 讲解 ， 
无 论 读者 具有 怎样 的 经 验 层 次 和 背景 都 能 理解 。 如 末 想 快速 上 手 ， 本 
书 将 十 读 首 的 不 二 之 选 。 我 曾 多 次 推荐 本 书 ， 忌 能 被 多 数 人 欣然 接 
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Tom Bilcze 


Westfield 集团 首席 数据 库 设 计 师 


本 书 是 数据 建 模 初学 者 以 及 想 拥 有 “话语 权 ” 并 想 理 解 建 模 概 念 的 
人 的 必 读 之 作 。 读 者 在 阅读 时 ， 会 有 种 作者 陪伴 左右 的 感觉 ， 作 者 会 
问 你 逐一 介绍 各 个 术语 ， 解 释 各 个 符 写 ， 告 诉 你 动手 之 前 、 建 模 过 程 
中 以 及 建 模 结束 之 后 应 该 考虑 什么 。 


Robert S. Seiner 


总 统 KIK 咨 询 及 教育 服务 有 限 贡 任 公司 总 裁 


tdan.com 数 据 管理 简讯 责任 人 


作为 每 天 需要 工作 的 数据 染 构 师 ， 有 时 甚至 会 起 记 为 什么 进行 数 
据 建 模 。 我 只 是 知道 了 工作 主题 并 按 目 己 习 惯 的 工作 方式 完成 任务 。 
我 需要 一 个 有 用 的 定义 ， 但 有 时 候 发 现 很 难 和 其 他 人 解释 明日 ， 我 采 
用 Steve 的 示例 与 他 们 交流 ， 告 诉 他 们 我 要 做 什么 以 及 为 什么 这 样 做 ， 
令 人 高 兴 的 古 所 有 人 都 能 明白 。 


James Lee 


健康 服务 数据 架构 、 报 表 主 管 


这 年 一 部 近乎 完 类 的 图 书 ， 其 内 容 上 黎 兰 面 广 ， 但 同时 又 将 所 教授 
的 内 容 保 持 在 一 个 合理 的 水 平 ， 保 证 其 简洁 性 和 易 用 性 。 本 书 的 可 读 
性 很 强 我 几 次 就 读 完 了 ) ， 将 一 个 有 效 且 易于 理解 的 名 片 案例 贯穿 
始终 。 


Wayne Little 


Creative 数 据 解 决 方案 公司 CEO 


在 我 的 生命 中 有 许多 大 咖 (BOVE EWE) ， 指 引 我 前 行 。 


这 些 从 事 数据 管理 行业 的 大 咖 有 : UML 领域 专家 Mickael Blaha; 
善于 语言 表达 的 Wayne Eckerson; 对 于 数据 建 模 富有 极 大 热情 〈 而 且 
对 我 的 第 1 版 图 书 给 出 了 中 肯 的 评价 和 建议 ， 并 在 第 2 版 中 做 了 相应 修 
改 ) 的 David Hay; 数据 仓库 领域 的 卓越 贡献 者 以 及 对 非 结构 化 数据 处 
理 等 未 来 趋势 具有 敏锐 观察 力 的 Bil Inmon; 带 来 了 元 数据 主流 处 理 方 
法 的 Dave Marco; 推动 数据 治理 领域 的 发 展 ， 并 发 行 了 数据 管理 业界 
极 具 价值 的 刊物 Tdan.com 的 Bob Seiner; 引发 如 何 建 立 数据 模型 的 思 
考 ， 并 给 出 了 如 何 提高 团队 合作 的 实践 性 技术 的 Graeme Simsion; 多 
才 多 艺 且 广泛 涉猎 智能 商业 、 数 据 建 模 、 职 业 规 划 、PowerPoint、 摄 
影 、 啤 酒 等 领域 的 David Wells ° 


数据 大 咖 们 还 通过 像 DAMA 这 样 的 用 户 组 推动 着 数据 管理 领域 的 
发 展 ， 通 过 志愿 服务 、 个 人 按 月 或 按 季 度 组 织 学 术 讨论 、 安 排 大 会 发 
言 、 搂 写 报告 等 活动 推动 行业 进步 ， 并 与 各 类 从 业者 紧密 相连 。 由 于 
篇 幅 有 限 ， 在 此 列举 出 一 些 与 我 共事 多 年 的 数据 大 咖 : Kasi 


Anderson ` Davida Berger ` Tom Bilcze ` Michael Brackett ` Jimmy 
Chen ` Susan Earley ` Ben Ettlinger ~ Deborah Henderson ` Jeff Lawyer ` 
Carol Lehn ` Wayne Little ` Mark Mosley ` Bill Nagel ` Cathy Nolan ` 
John Schley 、 Ivan Schotsmans 和 Anne Marie Smith. 


还 有 其 他 人 对 这 本 书 的 出 版 给 予 了 积极 支持 。 感 谢 Bil Graeme 和 
Michael 对 本 书 内 容 的 补充 感谢 Jean 对 第 1 版 的 修订 ， 感谢 Carol 册 色 
的 编辑 工作 ， 感 谢 Mark 非 常 精彩 的 封面 设计 ， 感 谢 Abby 完 美的 卡通 
计 。 


当然 还 应 该 感谢 那些 数据 世界 以 外 的 人 们 。 感 谢 父亲 的 正直 诚 
> 职业 道德 以 及 解决 问题 的 能 力 。 感 谢 母 杀 为 我 树立 了 一 个 热爱 分 
ave ! 的 榜样 。 感 谢 Jenn 一 直 让 我 的 生活 很 甜蜜 。 感 谢 Sadie 和 Jamie 一 
直 陪 伴 着 我 ， 并 且 提 醒 我 让 每 天 的 生活 简单 化 。 


数据 模型 是 构建 应 用 系统 的 核心 ， 是 尽 可 能 精准 地 表示 业务 运转 
的 概念 性 框架 。 数 据 模型 定义 了 操作 者 、 行 为 以 及 管理 业务 处 理 流程 
的 规则 ， 并 将 定义 内 容 用 人 们 和 应 用 程序 都 能 理解 的 标准 语法 进行 描 
述 。 本 质 上 ， 数 据 模 型 将 业务 中 涉及 的 概念 转换 为 计算 机 代码 ， 以 致 
于 应 用 程序 和 计算 机 系统 都 能 按 设计 者 的 意图 处 理 各 类 信息 。 如 果 没 
有 数据 模型 ， 任 何 组 织 机 构 都 不 可 能 实现 信息 的 目 动 化 处 理 。 


鉴于 数据 模型 在 应 用 系统 开发 过 程 中 扮演 着 关键 角色 ， 坚 无 疑 
问 ， 数 据 模型 将 决定 应 用 系统 开发 及 使 用 效率 。 即 便 程 序 设计 方面 已 
经 做 到 了 完美 ， 但 不 良 的 数据 模型 设计 同样 会 带 来 灾难 性 的 破坏 。 执 
行 性 能 下 降 ， 不 精确 的 查询 结果 ， 没 有 弹性 的 规则 和 不 一 致 的 元 数据 
等 都 是 不 恨 数据 模型 引发 的 后 果 。 


男 一 方面 ， 设 计 精 民 的 数据 模型 是 企业 用 户 与 信息 技术 专家 之 间 
的 桥梁 。 在 应 用 系统 项 目 开发 之 初 ， 借 助 数据 模型 企业 与 信息 技术 专 
家 间 束 业务 运转 达成 共识 。 信 息 技术 专家 将 业务 运转 用 概念 数据 模型 
及 逻辑 数据 模型 进行 描述 。 企 业 用 户 则 可 以 对 模型 进行 审阅 ， 在 编写 
程序 代码 之 前 对 模型 进行 必要 的 更 正和 改进 。 


很 难 想 象 有 谁 能 像 本 书 作 者 Steve Hoberman 那 样 ， 用 如 此 简单 朴 
素 的 语言 解释 数据 模型 ， 很 多 数据 模型 工程 师 因 此 沉醉 于 他 们 的 工作 
实践 中 。 如 果 没 有 Steve， 谁 可 能 将 Steve 为 The Data Warehousing 
Institute 讲 授 的 课程 教 得 如 此 生动 有 趣 ， 清 晰 明了 ? 像 在 Steve 所 闭 的 为 


一 本 著作 (The Data Modeler’s Workbench) 中 看 到 的 一 样 ，Steve 不 仅 
知识 渊博 ， 而 且 还 非常 善于 与 各 种 读者 沟通 。Steve 对 于 数据 建 模 技 术 
拥有 无 与 伦比 的 热情 和 能 量 。 同 时 ，Steve 还 是 我 们 研究 中 心里 一 位 最 
受 他 人 爱戴 的 成 员 之 一 。 


符合 庞大 的 需求 。 非 常 高 兴 Steve 决 定 撰 写 这 本 著作 ， 因 为 这 类 图 
书 拥有 巨大 的 市 场 需求 。 即 使 数据 模型 对 于 应 用 系统 的 开发 至 关 重 
要 ， 但 仍 有 一 大 批 业 务 人 员 和 部 分 技术 人 员 缺 乏 对 数据 模型 的 理解 。 
这 本 和 涛 作 的 问世 ， 无 疑 将 唤起 众多 业务 及 技术 人 员 对 数据 模型 重要 性 
的 认识 。 


等 别 地 ， 那 些 应 用 系统 开发 的 倡议 人 ， 或 被 安排 进项 目 组 的 业务 
人 员 ， 将 发 现 这 本 著作 是 非常 适宜 的 入 门 读物 。 对 于 刚刚 入 行进 行 应 
用 系统 设计 的 专业 技术 人 员 ， 这 本 著作 同样 古 快 捷 、 信 单 学 习 数 据 建 
模 基 础 的 优秀 读物 。 大 学 教授 为 了 帮助 学 生 们 掌握 数据 建 模 的 有 天 概 
念 、 术 语 、 成 功 准 则 等 ， 这 本 著作 也 很 值得 推荐 给 他 们 。 


一 Wayne W. Eckerson 


数据 仓库 研究 服务 中 心 主任 


相信 很 多 读者 和 我 一 样 ， 通 向 都 会 略 过 前 言 直接 进入 正文 。 但 还 
年 强烈 推荐 读者 能 先 从 前 言 部 分 开局 本 书 之 旅 。 前 言 将 帮助 读者 对 每 
一 单元 、 每 一 章 拉 有 一 个 大 体 认识 ， 并 事先 了 解 各 部 分 的 学 习 目 标 。 


本 书 的 10 个 目标 
1. 将 会 理解 在 什么 情况 下 需要 数据 模型 ， 以 及 各 种 情形 下 最 适当 
的 数据 模型 类 型 是 什么 。 


2， 能 像 阅读 一 本 小 说 那样 ， 轻 松 自如 地 读 懂 任 何 规模 和 复杂 度 的 
模型 。 


3. 具备 创建 完整 的 规范 化 关系 数据 模型 和 维度 模型 的 能 


A. 具备 将 一 个 逻辑 模型 转换 为 高 效 物理 模型 的 能 力 。 


5. 具备 使 用 模板 工具 ， 高 效 获取 应 用 需求 的 能 


6. 具备 解释 数据 模型 记分 卡 中 10 个 计 分 项 的 能 


7. 掌握 如 何 与 其 他 人 员 建 立民 好 工作 关系 的 实践 经 验 。 
8. 了 解 非 结 构 化 数据 及 其 模型 化 。 
9. 了 解 UML 的 基本 概念 。 


10. 具备 XML 环 境 中 创建 数据 模型 的 能 力 ， 并 了 解 元 数据 和 敏捷 
开关 的 基本 概念 。 


本 书包 含有 5 个 部 分 ， 第 1 部 分 引入 数据 建 模 ， 并 介绍 了 数据 建 模 
的 目的 和 变化 。 第 2 部 分 说 明 数 据 模 型 中 的 所 有 组 件 。 第 3 部 分 介绍 天 
系 型 和 维度 型 概念 模型 、 逻 辑 模 型 和 物理 模型 。 第 4 部 分 则 关注 如 何 使 
用 模板 提高 数据 模型 质量 ， 介 绍 数 据 模 型 记分 卡 以 及 如 何 与 业务 人 
员 、 项 目 团 队 高 效 沟通 。 第 5 部 分 讨论 天 于 数据 建 模 的 常见 疑 问 。 


将 本 书 内 容 与 10 个 学 习 目 标 关联 起 来 看 ， 第 1 部 分 的 前 半 节 完成 了 
目标 1， 第 2 部 分 完成 了 目标 2， 第 3 部 分 完成 了 目标 3 和 4， 第 4 部 分 完成 
了 目标 5、6 和 7， 第 5 部 分 则 完成 目标 8、9 和 10 © 


第 1 部 分 由 3 章 组 成 。 第 1 章 引入 数据 模型 ， 并 通过 两 个 实例 ( 冰 淇 
淋 和 名 片 ) 说 明 数 据 模型 的 作用 ， 这 两 个 实例 贯穿 始终 ， 便 于 读者 对 
需求 分 析 到 模型 设计 的 整个 建 模 过 程 有 所 认识 。 第 2 草 介绍 了 数据 模型 
的 两 个 非常 有 价值 的 特征 : 交流 性 和 精确 性 。 同 时 本 章 还 束 数 据 模 型 
最 行 之 有 效 的 领域 给 予 讨论 。 第 3 章 将 数据 模型 与 照相 机 做 以 类 比 ， 说 
明 关 于 照相 机 的 4 种 设置 同样 适用 于 数据 模型 。 理 解 4 种 设置 对 数据 模 
型 的 影响 将 极 大 增加 建 模 成 功 的 可 能 性 。 GE: 应 用 系统 是 为 特定 用 


户 设计 的 以 实现 一 定 功 能 的 一 个 程序 或 程序 集 ， 如 文字 处 理 系统 、 订 
单 处 理 系统 、 利 润 报表 系统 等 。) 


第 2 部 分 包含 随后 的 4 草 ， 用 以 介绍 数据 模型 组 件 。 第 4 章 介绍 实 
体 ， 第 5 章 介绍 属性 ， 第 6 草 介 绍 关 系 ， 第 7 章 介绍 键 。 


第 3 部 分 由 随后 的 3 章 构 成 ， 其 中 讨论 了 概念 模型 、 逻 辑 模型 和 物 
理 模 型 这 3 种 不 同类 型 的 模型 。 第 8 章 着 重 学 习 概 念 模型 并 讨论 了 在 创 
建 概 念 模型 过 程 中 的 3 种 变化 。 第 9 章 学 习 关 系 及 维度 逻辑 模型 。 第 10 
章 介绍 物理 模型 ， 重 点 学 习 使 用 反 规 范 化 和 分 区 等 不 同 技术 实现 物理 
模型 的 高 效 设计 ， 同 时 还 将 学 习 渐 变 维度 模型 。 


第 4 部 分 包含 3 革 内 容 。 讲 解 如 何 使 用 模板 、 数 据 模型 记分 卡 及 如 
何 有 效 地 与 业务 人 员 、 项 目 组 成 员 进 行 区 流 沟通 ， 从 而 提高 数据 模型 
质量 。 第 11 草 推荐 了 多 种 用 于 获取 、 验证 用 户 需求 的 模板 ， 模 板 的 使 
用 将 有 助 于 降低 时 间 开 销 并 提高 建 模 精度 。 第 12 章 讲解 数据 模型 记分 
卡 以 验证 数据 模型 质量 。 第 13 章 介绍 了 如 何 与 其 他 团队 成 员 协 作 以 及 
高效 共事 的 一 些 实践 经 答 。 


第 5 部 分 也 包含 3 章 内 容 ， 其 中 介绍 了 凌 敬 于 数据 建 模 之 上 的 有 关 
主题 。 第 14 章 介绍 非 结构 化 数据 ， 因 为 非 结构 化 数据 的 处 理 是 当前 流 
行 的 趋势 。 本 章 介绍 了 分 类 、 本 体 两 个 处 理 技术 。 人 第 15 章 学 习 统一 建 
模 语 言 UML 中 涉及 数据 模型 的 内 容 。 人 第 16 章 给 出 了 经 常 被 提 及 的 5 个 
疑问 ， 并 一 一 解答 ， 其 中 包括 XML、 元 数据 、 敏 捷 开 发 。 


第 2 版 在 第 1 版 的 基础 上 做 了 很 大 的 改进 。 所 有 章节 相 比 第 1 版 都 变 
化 很 多 ， 其 中 更 多 地 引入 了 新 技术 和 示例 。 而 且 第 2 版 更 注重 数据 模型 


创建 过 程 。 作 为 强化 概念 ， 关 键 点 部 被 添加 至 每 草 的 结尾 。 每 草 开 篇 
之 处 也 添加 了 3 行 新 体 诗 ， 给 出 了 各 章 梗概 。 


本 书 还 引入 一 则 新 术语 ， 路 径 搜寻 (Wayfinding) ， 并 重点 介绍 
了 如 “元 数据 "等 多 个 建 模 领域 中 容易 被 混淆 的 概念 。 本 书 还 添加 一 些 
很 有 针对 性 的 习题 ， 并 给 出 了 参考 答案 。 本 书 最 后 还 罗列 出 本 书 涉及 
的 全 部 名 词 解释 。 


本 书 的 男 一 大 特色 在 于 其 并 非 由 一 名 作者 独立 完成 。 在 写作 之 
初 ， 我 曾 尝 试 撰写 有 天 UML 和 非 结 构 化 数据 有 关 的 内 容 ， 但 我 很 快 音 
识 到 其 他 专家 学 者 的 作品 更 好 。 于 是 请 Graeme Simsion ` Bill Inmon 和 
Michael Blaha 这 3 位 专家 分 别 撰写 了 本 书 的 第 13 章 、 第 14 章 和 第 15 章 。 


数据 建 模 不 只 是 一 种 工作 或 职业 ， 它 还 是 一 种 思想 ， 一 种 无 价 的 
过 程 和 生活 方式 。 但 请 尽量 保持 其 简单 实用 ， 现 在 一 起 开始 建 模 之 旅 
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第 1 部 分 “数据 建 模 简介 


第 1 部 分 将 引入 数据 建 模 ， 并 介绍 了 数据 模型 的 目的 及 其 类 型 。 完 
成 该 部 分 学 习 之 后 ， 读 者 将 可 以 对 在 什么 情况 下 需要 引入 数据 模型 进 
行 判 断 ， 并 可 以 根据 实际 情况 选择 适当 的 数据 模型 类 型 。 读 者 还 应 该 
可 以 通过 数据 模型 特征 进行 模型 评 佑 ， 并 能 针对 特定 的 模型 确定 其 特 
征 的 优 劣 及 确定 该 模型 与 其 创建 目的 是 否 吻合 。 


第 1 草 将 引入 数据 模型 ， 并 通过 两 个 实例 对 这 一 强 有 力 工具 进行 前 
述 。 这 两 个 实例 也 将 贯穿 整 本 教程 。 因 为 我 个 人 侦 好 甜品 ， 所 以 一 个 
实例 与 冰淇淋 有 关 E, KEHO 。 另 外 一 个 实例 是 对 名 片 进行 数 
据 建 模 。 无 论 是 冰淇淋 ， 还 是 名 片 ， 都 用 来 说 明 建 模 扩 术 ， 这 样 读者 
可 以 从 需求 分 析 到 模型 设计 了 解 整个 建 模 过 程 。 


第 2 章 介 绍 了 数据 模型 的 两 个 非常 有 价值 的 特征 : 交流 性 和 精确 
性 。 读 者 将 了 解 到 模型 交流 性 如 何 体现 以 及 3 种 可 能 弱化 模型 精确 性 
的 情形 。 本 草 还 从 业务 及 应 用 程序 两 个 领域 对 数据 模型 的 应 用 进行 了 
说 明 。 


第 3 革 将 数据 模型 与 照相 机 进行 比 对 ， 说 明 用 于 照相 机 的 4 种 设置 
可 以 完美 适用 于 数据 模型 。 对 数据 模型 设置 的 理解 将 极 大 增加 应 用 程 
序 开发 成 功 的 可 能 性 。 本 章 还 比 对 了 图 像 格 式 与 数据 模型 ， 由 此 引入 
数据 模型 的 3 个 层次 概念、 人 逻辑、 物理。 


第 1 章 ”数据 模型 


我 怎样 才能 到 达 目 的 地 ? 
地 图 、 设 计 蓝 图 、 数 据 模型 
请 为 我 指引 迷津 。 


当 我 义 一 次 意识 到 目 己 完全 迷路 的 时 候 ， 我 虱 恼 地 重重 扣 了 一 下 
方 回 盘 。 要 知道 ， 我 正 独 目 行驶 在 法 国 的 公路 上 ， 赶 着 去 参加 一 个 非 
党 重要 的 商务 会 议 ， 而 且 此 时 距离 天 亮 还 有 一 个 小 时 ， 还 好 我 发 现 前 
方 有 一 家 正 准备 开张 的 加 油 站 ， 我 停 下 来 ， 走 了 进去 ， 并 把 目的 地 的 
地 址 拿 出 来 给 服务 员 看 。 


我 不 会 说 法 语 ， 那 个 服务 员 也 不 会 讲 喘 语 ， 我 需要 帮助 ， 但 无 法 
通过 言语 交流 ， 浴 亏 他 认 出 了 我 要 访问 的 公司 的 名 字 ， 最 后 他 拿 出 了 
纸 笔 ， 给 我 画 了 一 张 示意 图 。 如 图 1.1 所 示 ， 他 用 线条 表示 街道 ， 用 圆 
圈 表 示 环 岛 路 口 并 配 有 相应 的 数字 表示 出 口 ， 还 用 矩形 框 表 示 加 油 站 
(Petrol) 和 我 的 目的 地 (MFoods) 。 


这 个 由 服务 员 绘 制 的 地 图 里 ， 只 包含 与 我 的 行程 相关 的 信息 ， 在 
它 的 帮助 下 ， 我 顺利 抵达 目的 地 。 事实 上 这 张 地 图 就 是 一 个 我 放生 
所 需要 的 实际 道路 的 模型 。 


地 图 是 对 复杂 地 理 景观 (geographic landscape) 的 简化 ， 同 理 ， 
数据 模型 也 是 对 复杂 信息 景观 (information landscape) 的 简化 ， 本 章 
将 以 冰淇淋 和 名 片 为 例 ， 介 绍 被 誉 为 路 径 搜寻 工具 (wayfinding tool) 
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图 1.1 简单 的 地 理 景观 示意 图 


1.1 路径 搜寻 说 明 


如 果 “ 数 据 模型 "不 能 引起 你 或 你 的 业务 伙伴 们 的 兴趣 ， 你 可 以 使 
用 “路 径 搜寻 (wayfinding) "FLL, PACS SARE PT A Be ka 
物 使 用 的 技术 及 工具 ， 以 实现 从 一 个 地 点 抵达 到 另外 一 个 。 如 果 一 位 
旅行 者 用 天 空中 的 星斗 导航 ， 那 么 星斗 便 是 他 的 路 径 搜寻 工具 ， 同 
理 ， 地 图 、 指 南 针 也 都 是 此 类 工具 。 


所 有 的 模型 也 是 路 径 搜 寻 工 具 。 模 型 是 一 组 文字 及 各 类 符号 的 集 
合 ， 用 来 将 一 个 复杂 的 概念 简单 化 。 我 们 生活 在 一 个 令 人 眼花 综 乱 的 
世界 ， 人 们 很 难 将 注意 力 集中 在 一 些 关 键 信息 上 ， 从 而 无 法 做 出 一 个 
明智 的 决策 。 而 地 图 可 以 帮助 旅行 者 游览 一 座 城市 ， 组 织 结构 图 可 以 
帮助 员工 理解 组 织 间 的 相互 关系 ， 设 计 蓝 图 则 可 以 帮助 建筑 师 交流 建 
造 计划 。 所 以 ， 地 图 、 组 织 结构 几 、 设 计 监 图 都 是 对 复杂 事物 的 过 滤 
和 简化 ， 以 帮助 人 们 理解 现实 世界 ， 提 高 路 径 搜 寻 能 力 。 


在 法 国 的 这 次 旅行 ， 要 不 是 加 油 站 服务 员 绘 制 了 地 图 ， 让 我 立刻 
明日 如 何 抵 达 目 的 地 ， 我 可 能 得 多 伦 几 个 小 时 ， 并 且 不 断 碰壁 。 模 型 
则 使 用 一 些 标准 符号 让 人 们 快速 地 理解 相应 的 内 容 。 例 如 ， 在 服务 员 
绘制 的 地 图 里 ， 他 用 线条 表示 街道 ， 用 圆圈 表示 环岛 路 口 ， 正 是 这 
从 号 帮助 我 在 脑海 中 映射 出 一 条 条 街道 和 一 个 个 路 口 。 
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1.2 ”数据 模型 说 明 


当 我 还 在 读 大 学 的 时 候 ， 课 笔 上 教授 们 经 常会 在 挂图 板 上 写 下 大 
量 内 容 ， 而 学 生 们 则 疫 于 整理 笔记 。 在 这 种 情况 下 , “信息 过 
载 ” (information overload) 可 以 用 来 形容 这 种 状况 ， 即 当前 的 信息 量 
超出 了 大 脑 所 能 接受 的 最 大 信息 量 。 此 时 最 好 在 校园 里 闲逛 一 会 ， 亦 
或 打 打 网球 ， 亦 或 玩 半 小 时 的 太空 入 侵 者 游戏 (Space Invaders) ， 让 
寻 心 得 以 放松 ， 以 便 接 受 更 多 信息 。 然 而 现代 社会 ， 人 们 创造 并 接受 
越 来 越 多 的 信息 ， 但 休 妃 、 放 松 的 时 间 却 越 来 越 少 。 而 且 我 经 党 听 到 
这 样 的 说 法 一 在 世界 范围 内 ， 信 息 量 以 每 年 60% 的 速度 递增 ， 这 让 我 
不 禁 感 叹 ， 在 如 此 众多 的 信息 面前 ， 我 们 真正 掌握 、 理 解 的 信息 是 多 
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幸运 的 是 ， 数 据 模型 这 一 工具 可 以 帮助 我 们 有 效 地 简化 所 有 信 
妃 。 类 似 于 路 径 搜寻 工具 ， 无 论 是 商务 专员 ， 还 是 IT 专家 ， 都 可 以 有 
效 地 使 用 数据 模型 ， 即 利用 一 组 符号 、 文 本 来 准确 表达 真实 信息 的 精 
简 子 集 ， 以 便 改善 某 一 组 织 内 部 的 交流 、 沟 通 ， 并 提供 一 个 更 灵活 、 
更 健壮 的 应 用 环境 。 例 如 ， 在 法 国 地 图 上 用 线条 表示 公路 。 又 如 ， 在 
数据 模型 里 可 以 把 “客户 ”这 两 个 字 用 抢 形 框 起 来 ， 表 示 一 些 实际 、 具 
体 的 客户 ， 如 Bob、IBM、Walmart。 


换言之 ， 地 图 是 对 复杂 地 理 景观 的 简化 ， 而 数据 模型 则 是 对 复杂 
信息 景观 的 简化 。 很 多 情形 下 ， 现 实数 据 的 极其 复杂 性 使 得 数据 模型 
看 起 来 异常 简单 ， 例 如 服务 员 给 我 绘制 的 那些 环岛 路 口 。 


数据 模型 是 一 组 由 符号 、 文 本 组 成 的 集合 ， 用 以 准确 表达 信息 景 
观 ， 达 到 有 效 交 流 、 沟 通 的 目的 。 擅 述 信息 景观 的 方式 多 种 多 样 ， 本 
书 主要 使 用 矩形 框 、 线 段 等 元 素描 述 数据 模型 ， 当 然 还 可 以 使 用 统一 
建 模 语言 (UML) 类 图 (Class Diagrams) 、 电 子 表格 
(spreadsheets) 、 状 态 转 换 图 (State Transition Diagrams) 。 所 有 这 些 
模型 都 可 以 视 为 在 复杂 信息 世界 里 的 路 径 搜 寻 工 具 ， 都 可 以 显示 对 复 
杂 信 息 世 界 的 人 简化。 


1.3 ”有 趣 的 冰淇淋 


电子 表格 可 能 是 我 们 在 日 党 工作 生活 中 最 熟悉 的 一 种 数据 模型 。 
电子 表格 是 纸 质 工作 表格 的 一 种 表示 形式 ， 表 单 中 包含 由 行 和 列 构 成 
的 网 格 ， 网 格 中 的 每 个 单元 格 部 可 以 存放 文本 或 数 子 ， 表 单 中 的 列 通 
常 表示 不 同类 型 的 信息 。 假 设 我 刚刚 结束 一 段 旅程 返回 罗 与 ， 我 喜欢 
那里 的 冰淇淋 (gelato) ， 当 我 们 一 起 走 进 一 个 冰淇淋 店 时 ， 你 应 该 会 
注意 到 几 个 表单 ， 表 1.1 为 一 个 冰淇淋 口味 列表 ， 表 1.2 则 包含 了 冰淇淋 
大 小 及 价格 信息 。 


表 1.1 冰淇淋 口味 


表 1.2 冰淇淋 大 小 及 价格 


2 是 2.25 


3 是 2.60 


上 述 表单 也 是 一 个 数据 模型 ， 因 为 它 用 一 组 符号 集合 (本 例 中 用 
的 是 文本 ) 来 描述 现实 世界 的 一 些 事物 《本 例 中 描述 了 美味 的 冰淇淋 
口味 及 其 价格 ) 。 你 们 猜 猜 我 来 了 几 匙 巧克力 口味 的 冰淇淋 ? 


数据 模式 形式 (data model format) 是 本 书 的 主题 之 一 ， 而 且 与 上 
例 中 的 表单 非常 类 似 。 虽 然 数据 模型 是 一 个 较 宽 泛 的 概念 ， 但 这 里 需 
要 注意 的 是 当 使 用 数据 模型 这 一 术语 时 ， 其 形式 需 引 起 我 们 足够 的 重 
视 。 但 不 同 于 数据 表单 ， 数 据 模型 应 满足 如 下 要 求 。 


。 只 包含 类 型 :数据 模型 中 通常 无 需 显 示 ， 如 巧克力 或 3 不， 这 样 具 
体 的 数据 ， 需 要 显示 的 是 数据 对 应 的 概念 或 类 型 。 比 如 ， 上 述 数 
据 模型 中 显示 的 类 型 为 冰淇淋 口味 ， 而 非 巧 克 力 或 香草 这 样 具体 
的 值 ， 还 显示 了 冰淇淋 大 小 ， 而 不 古 具 体 的 值 ，1 是 或 2 是 。 

包含 相互 作用 : 数据 模型 还 需要 抓 住 不 同 概念 、 类 型 间 的 相互 作 
用 。 比 如 ， 冰 湛 淋 口味 与 大 小 之 间 的 相互 作用 十 什么 ?如 果 有 人 
要 买 3 古 冰 诺 淋 ， 那 么 这 3 古 是 同一 种 口味 ， 还 是 3 种 不 同 的 口味 。 
正如 冰淇淋 口味 与 大 小 间 的 相互 作用 ， 在 一 个 数据 模型 中 要 求 表 
述 不 同类 型 间 的 相互 作用 。 

提供 一 个 简洁 的 交流 媒介 : 比 起 仅 使 用 数据 表单 进行 交流 ， 用 包 
台数 据 模 型 的 文档 交流 ， 其 效率 要 高 得 多 。 数 据 模 型 显示 各 个 类 
型 ， 并 用 人 稍 单 且 有 效 的 符号 表达 它们 之 间 的 相互 作用 。 对 于 冰 席 
淋 这 个 实例 ， 为 了 有 效 描述 各 个 类 型 以 及 它们 之 间 的 相互 作用 ， 
显然 数据 模型 是 种 更 为 精练 的 工具 ， 而 仅 使 用 数据 表单 往往 达 不 
到 这 样 的 效果 。 


1.4 ”有趣 的 名 片 


fF (Business Card) 包含 了 丰富 的 关于 某 人 及 其 单位 的 信息 。 本 
书 中 ， 我 会 用 名 片 作 为 基本 模型 ， 来 阐述 许多 与 数据 模型 相关 的 概 
念 ， 通 过 构建 一 个 名 片 数据 模型 ， 我 们 可 以 亲身 感受 到 从 具体 的 名 片 
上 能 获得 多 少 信息 ， 或 者 从 更 广泛 意义 上 的 联系 人 管理 领域 能 获得 多 


ae 
少 信 息 。 


我 打开 床头柜 抽 敢 〈 惊 人 的 是 自从 20 世 纪 90 年 代 中 期 抽 导 就 未 被 
整理 过 ) ， 抓 起 一 把 名 片 ， 铺 在 桌 上 ， 挑 出 最 有 趣 的 4 张 建 模 。 第 1 张 
征 我 本 人 现在 的 名 斤 。 第 2 张 是 多 年 以 前 妻子 和 我 创办 的 互联 网 公司 的 
名 片 。 还 有 一 张 是 一 位 魔术 师 的 名 片 ， 他 曾经 在 我 们 的 聚会 上 表演 
过 。 最 后 一 张 古 我 最 钟爱 的 一 家 饭店 的 名 片 。 为 了 保 扩 个 人 隐私 ,我 
修改 了 姓名 和 联系 方式 ， 如 图 1.2 所 示 。 


WALK AROUND MAGIC CHILDREN’S PARTIES 


Steve Hoberman 
President 


me @stevehoberman.com 

Visi Nee THE AMAZING ROLANDO 
isit www.stevehoberman.com MAGIC FOR ALL OCCASIONS 

10 Main St | New York, NY 10021 | 212-555-1212 BillSmith@TheAmazingRolando.com 


Steve Hoberman 
& Associates, LLC 


732-555-1212 BILL SMITH 


findsonline.com Jon Smith 


Internet Auction Experts xas 
ga € 
Steve@findsonline.com ew 


Jenn@findsonline.com Fax (908) 555-1212 
Banquet 554-1212 
Reservations@RaritanRiverClub.com 


Steve and Jenn 58 Church Avenue 


(973) 555-1212 New Brunswick, NJ 08901 
(908) 333-1212 


图 1.2 床头柜 里 的 4 张 名 片 


在 这 些 名 片上 你 能 看 到 什么 信息 ? 


假设 我 们 这 次 练习 的 目的 是 理解 名 片上 的 信息 ， 并 以 实现 一 个 成 
功 的 联系 人 管理 应 用 程序 为 最 终 的 目标 。 让 我 们 先 列 出 以 下 一 些 信 
= 由 


JON 


Steve Hoberman & Associates, LLC 


BILL SMITH 


Jon Smith 


212-555-1212 


MAGIC FOR ALL OCCASIONS 


Steve and Jenn 


58 Church Avenue 


FINE FRESH SEAFOOD 


President 


RIRAN EARE, RRR ba Ar, BEREA] h A 
有 的 信息 ， 对 于 帮助 理解 数据 模型 也 是 非常 有 限 的 。 进 一 步 地 ， 设 想 
一 下 如 采 我 们 要 处 理 的 和 名片 不 仅仅 局 限于 4 张 ， 而 是 扩 天 到 床头柜 里 的 
所 有 名 片 ， 或 者 更 糟 ， 扩 大 到 曾经 收 到 的 每 一 张 名 族 ! 很 快 ， 数 据 量 
MEA T ° 


数据 模型 将 数据 汇总 ， 从 而 让 它们 更 容易 理解 。 例 如 ， 我 们 查看 
下 列 数据 ， 发 现 这 组 数据 适合 放 在 一 个 被 命名 为 “公司 名 称 ” (Company 
Name) 的 数据 组 中 (电子 表格 中 的 列 标题 。 


Steve Hoberman & Associates, LLC 
The Amazing Rolando 
findsonline.com 


Raritan River Club 


另外 一 个 电子 表格 中 的 列 标题 应 该 为 "电话 号 码 ”(Phone 
Number) 。 表 1.3 为 一 个 列 出 部 分 名 所 信息 的 表单 。 


表 1.3 名 片 信息 


a 公司 名 ee 
Steve Hoberman & Associates, LLC | 212-555-1212 


The Amazing Rolando 732-555-1212 
Raritan River Club (908) 333-1212 (908) 555-1212 554-1212 


再 进一步 做 这 个 练习 ， 我 们 可 以 将 名 所 中 的 不 同 数据 组 织 到 以 下 
各 个 组 中 。 


姓名 Person name 
职务 Person title 
公司 名 称 Company name 
电子 邮箱 Email address 
网 页 Web address 


通信 地 址 Mailing address 


电话 号 码 Phone number 
标志 Logo (the image on the card) 


专业 Specialties (such as “MAGIC FOR ALL 
OCCASIONS”) 


至 此 ， 结 束 了 吗 ? 这 组 列表 束 古 一 个 数据 模型 ? 答案 是 否定 的 。 
我 们 丢失 了 一 个 关键 要 素 : 数据 组 之 间 的 相互 作用 或 关系 。 例 如 ， 公 
司 名 称 和 电话 号 码 之 间 有 什么 关系 ? 一 个 公司 可 以 有 多 个 电话 号 码 
吗 ? 一 个 电话 号 码 可 以 属于 多 个 公司 吗 ? 没有 电话 号 码 ， 一 个 公司 可 
以 存在 吗 ? 在 建立 数据 模型 的 过 程 中 ， 这 一 类 问题 都 需要 被 提出 并 解 


答 o 


为 了 建立 任何 一 种 路 径 搜 寻 工 具 ， 人 们 通常 在 迷路 足够 多 次 之 
后 ， 才 有 可 能 发 现 正确 的 路 径 ， 例 如 第 一 个 为 某 地 区 绘制 地 图 的 人 ， 
一 定 会 花费 很 多 时 间 ， 走 过 很 多 弯路 ， 才 能 完成 其 工作 。 可 见 绘制 地 
图 羡 一 个 具有 挑战 性 并 需要 一 定时 间 伦 销 的 过 程 。 


创建 并 完成 一 个 数据 模型 往往 会 遇 到 相同 的 情形 ， 与 概念 “数据 模 
型 "相应 地 还 有 一 个 概念 “数据 建 模 ”。 数 据 建 模 是 建立 数据 模型 的 过 
程 ， 更 具体 地 说 ， 数 据 建 模 为 了 明确 某 一 组 织 结构 及 其 操作 ， 而 使 用 
一 组 技术 和 实施 一 些 活动 ， 即 近 出 一 个 信息 解决 方案 ， 从 而 实现 该 组 
织 的 某 些 目 标 。 当 然 在 数据 建 模 过程 中 ， 还 需要 很 多 技能 ， 如 专心 聆 
听 ， 尽 可 能 提出 大 量 问 题 ， 甚 至 耐心 。 


数据 建 模 者 有 要求 能 与 来 目 不 同 部 门 ， 具 有 不 同 技术 背景 ， 不 同业 
务 经 验 ， 不 同 技能 水 平 的 人 员 交 流 、 沟 通 。 在 交流 中 ， 数 据 建 模 者 不 


仅 需要 理解 每 个 人 员 的 观点 ， 而 且 还 需要 通过 反馈 证 明理 解 无 误 ， 最 
终 作 为 组 件 ， 构 建 在 模型 中 。 在 一 个 项 目的 初期 ， 通 常数 据 建 模 者 没 
必要 去 处 理 所 有 数据 模型 所 需 的 数据 ， 但 阅读 大 量 相关 文档 、 咨 询 数 
百 个 与 业务 有 关 的 问题 则 是 必要 的 。 


1.5 1: 教 教 你 的 邻居 


为 了 强化 数据 模型 认识 ， 读 者 可 以 试图 向 非 人 士 ， 如 邻居 、 家 
人 或 朋友 ， 解 释 这 一 概念 。 


他 们 听 屋 了 吗 ? 


在 本 书 的 后 面 有 关于 如 何 解释 数据 模型 这 一 概念 的 参考 答案 。 


V 路 径 搜寻 宫 括 所 有 被 人 类 或 动物 使 用 的 技术 及 工具 ， 以 实现 从 一 个 
地 点 抵达 到 另外 一 个 地 点 。 

V 数据 模型 是 一 组 由 符号 、 文 本 组 成 的 集合 ， 用 以 准确 表达 信息 景 
观 ， 达 到 有 效 交 流 、 沟 通 的 目的 。 


V 数据 模型 具有 多 种 表现 形式 ， 而 最 常见 并 得 到 广泛 理解 的 形式 为 电 
子 表格 。 

V 数据 模型 形式 是 本 书 的 主题 之 一 ， 它 与 电子 表格 非常 相似 ， 但 数据 
模型 基于 类 型 ， 包 含 相互 作用 和 可 扩展 性 。 


V 数据 建 模 是 建立 数据 模型 的 过 程 ， 需 要 很 多 与 技术 无 关 的 技能 ， 如 
专心 聆听 ， 尽 可 能 提出 大 量 问题 ， 甚 至 耐心 


第 2 章 为 什么 需要 数据 模型 


FES Ht 


数据 模型 是 精确 的 
0，1...... 还 是 很 多 。 


数据 建 模 是 构建 应 用 程序 的 必要 组 成 部 分 。 数 据 模型 之 所 以 如 此 
重要 ， 是 因为 它 所 市 来 的 两 大 核心 价值 一 交流 性 及 精确 性 。 数 据 模 型 
可 以 有 效应 用 于 业务 及 应 用 程序 开发 领域 ， 本 章 则 通过 讲述 数据 模型 
在 这 两 个 领域 的 使 用 ， 阐 明 数 据 模型 的 两 大 核心 价值 ， 你 将 学 习 到 数 
据 模 型 对 交流 的 促进 作用 和 能 削弱 数据 模型 精确 性 的 3 种 情形 。 


2.1 交流 性 


来 目 不 同 部 门 、 职 能 区 域 ， 以 具有 不 同 技术 育 景 和 业务 经 验 的 各 
类 人 员 时 第 需要 就 业务 问题 进行 讨论 并 最 终 做 出 决策 。 讨 论 中 ， 需 要 
明确 对 方 对 诸如 “客户 ”*% 销 售 * 等 这 类 概念 的 观点 。 数 据 模 型 作为 一 种 
理想 的 工具 ， 可 以 有 效 达 到 理解 、 记 录 并 最 终 协调 不 同 观 点 的 目的 。 


当 我 身 在 异国 ， 无 法 进行 言语 交流 时 ， 那 位 加 油 站 服务 员 为 我 绘 
制 的 地 图 模型 ， 使 我 明确 了 如 何 抵达 目的 地 。 无 论 我 们 想 答 试 着 去 了 
解 某 一 业务 中 的 一 些 重要 概念 如 何 与 其 他 概念 相关 联 ， 还 是 想 了 解 一 
个 已 经 使 用 了 近 20 年 的 订单 处 理 系统 的 运作 ， 数 据 模型 都 是 一 个 用 于 
解释 信息 的 理想 工具 。 


借助 数据 模型 ， 我 们 可 以 在 不 同 的 细 市 水 平 上 交流 相同 的 信息 。 

例如 ， 前 不 久 我 们 构建 了 一 个 用 于 描述 快餐 领域 消费 者 间 相 互 作用 和 
影响 的 高 层次 数据 模型 。 于 是 ， 当 有 消费 者 电话 投诉 公司 产品 时 ， 我 
们 所 构建 的 模型 将 存储 该 投诉 以 及 与 其 相关 的 信息 。 可 以 看 出 在 这 个 
项 目 中 ， 那 些 重 要 的 两 务 客 户 就 与 我 们 建立 的 这 个 高 层次 数据 模型 所 
展示 的 内 容 相 关联 。 数 据 模型 有 助 于 限定 项 目 范 围 ， 帮 助理 解 诸如 客 
户 、 产 品 及 相互 作用 等 天 键 观 念 ， 帮 助 建立 融洽 的 业务 天 系 。 几 个 月 
之 后 ， 我 们 使 用 更 细 化 的 模型 来 描述 消费 者 间 的 相互 作用 信息 

(consumer-interaction information) ， 并 癌 业 务 报表 制作 者 说 明 ， 在 每 
一 种 选择 条 件 下 ， 哪 些 信息 将 出 现在 报表 中 。 


基于 数据 建 模 的 交流 ， 并 非 只 是 在 建 模 结 束 后 才 开始 的 。 事 实 
上 ， 伴 随 着 数据 建 模 进程 ， 需 要 更 多 的 交流 和 知识 分 译 ， 即 交流 沟通 
在 建 模 中 与 建 模 后 都 同样 具有 价值 。 下 面 让 我 们 一 起 领略 建 模 过 程 和 
建 模 结果 所 市 来 的 交流 价值 的 更 多 细节 。 


2.1.1 ” 建 模 过 程 中 的 交流 


在 建立 数据 模型 的 过 程 中 ， 我 们 必须 分 析 数 据 及 数据 间 的 关系 ， 
我 们 别 无 选择 ， 必 须 对 所 要 模型 化 的 内 容 具 有 清晰 的 认识 。 人 们 在 建 
模 过 程 中 ， 相 互 挑战 、 质 疑 ， 从 而 获得 与 术语 、 假 设 、 规 则 和 概念 相 
关 的 大 量 知识 。 


在 为 一 家 大 型 制造 业 公 司 建 立 配方 管理 系统 (recipe management 
system) 数据 模型 的 过 程 中 ， 我 惊讶 地 目睹 了 具有 多 年 工作 经 验 的 项 
目 组 成 员 就 “组 件 ” (Ingredient) 的 概念 和 “原材料 ”(Raw Material) 的 
概念 是 否 存在 差别 进行 辩论 ， 经 过 30 分 钟 有 关 组 件 与 原材料 的 讨论 ， 
每 一 位 参加 建 模 的 人 员 都 从 中 受益 ， 当 结束 建 模 会 话 (modeling 
session) 时 ， 他 们 都 对 配方 管理 有 了 更 深入 的 理解 。 又 如 ， 以 模型 化 
名 所 为 例 ， 在 建 模 过 程 中 ， 将 学 习 到 许多 有 关 人 员 、 公 司 和 联系 人 管 
理 的 共识 。 

2.1.2” 建 模 过 程 后 的 交流 

创建 并 完成 的 数据 模型 是 讨论 在 应 用 程序 中 哪些 模块 应 该 被 构建 

的 基础 ， 甚 至 更 底层 的 ， 借 以 数据 模型 讨论 业务 流程 或 程序 功能 模块 


如 何 运作 。 数 据 模型 像 一 张 可 反复 使 用 的 地 岁 ， 无 论 是 分 析 师 、 建 模 
者 ， 还 是 开发 者 ， 都 可 以 利用 它 ， 了 解 他 们 各 目 关 心 的 对 象 如 何 工 


作 ， 正 如 第 1 位 地 图 制作 师 需要 经 历 艰 苦 的 学 习 ， 才 能 准确 记录 下 地 理 
景观 ， 为 他 人 导航 。 与 此 极其 相似 的 是 建 模 者 也 需要 经 历 类 似 的 训练 
(痛苦 但 却 有 益 ) 以 便 让 其 他 人 能 够 理解 一 个 信息 景观 (information 


landscape) 。 


当 我 准备 进入 一 家 大 型 制造 业 公 司 工 作 之 前 ， 我 的 新 任 主管 给 
我 一 本 公司 手册 ， 其 中 记录 了 一 组 与 公司 有 关 的 数据 模型 ， 当 我 阅读 
了 好 几 裔 之 后 ， 我 已 经 对 公司 业务 中 的 重要 概念 和 业务 规程 相当 熟悉 
了 。 所 以 ， 在 我 工作 的 第 一 天 ， 我 已 经 掌握 了 大 量 关 于 公司 业务 运作 
的 信息 ， 甚 至 当 同 事 们 提 太 一 些 专 有 术语 的 时 候 ， 我 也 能 熟知 它们 的 


忠 上 一 革 提 到 的 名 片 ， 一 旦 完成 相应 的 数据 模型 ， 其 他 人 就 可 以 
通过 该 模型 了 解 联系 人 管理 了 。 


2.2 ”精确 性 


数据 建 模 的 精确 性 指 的 是 阅读 模型 时 ， 其 中 的 每 一 个 符号 和 条 目 
都 是 清晰 、 无 二 义 性 的 。 你 可 能 与 其 他 人 和 争议 所 使 用 的 规则 是 否 准 
确 ， 但 这 与 我 们 所 强调 的 模型 的 精确 性 是 不 一 样 的 概念 。 换 言 之 ， 如 
果 你 看 到 模型 中 的 某 一 符号 并 说 “我 看 见 了 A”， 那 么 另外 一 个 看 到 这 
一 符号 的 人 不 可 能 说 “我 看 见 了 B”。 


再 回 到 那个 名 片 的 例子 ， 假 设 我 们 定义 “联系 人 ”为 名 片上 所 罗列 
的 人 或 公司 ， 或许 有 人 提出 “一 个 联系 人 有 多 个 电话 号 码 ”*”。 显然 这 个 
表述 是 不 精确 的 ， 因 为 我 们 不 确定 一 个 联系 人 是 否 可 以 没有 电话 号 
码 ， 或 者 必须 有 一 个 电话 号 码 ， 或 者 必须 有 多 个 电话 号 码 。 类 似 地 ， 
我 们 不 明确 是 否 允 许 出 现 一 个 未 与 任何 联系 人 关联 的 电话 号 码 ， 或 者 
一 个 电话 号 码 必 须 属于 某 一 位 联系 人 ， 或 者 可 以 属于 多 位 联系 人 。 数 
据 模 型 提出 的 精确 性 ， 要 求 将 这 些 模糊 的 表述 转换 为 以 下 断言 。 


。 每 一 位 联系 人 必须 和 一 个 或 多 个 电话 号 码 关联 。 
。 每 一 个 电话 号 码 必须 属于 一 位 联系 人 。 


由 于 数据 模型 引入 了 精确 性 ， 所 以 无 需 试图 花费 宝 贯 的 时 间 来 解 
释 模型 ， 相 反 ， 时 间 可 以 用 来 讨论 、 验 证 一 些 与 建立 某 一 模型 相关 的 


但 是 在 3 种 情况 下 ， 数 据 模型 的 精确 性 可 能 降低 。 


1. BEN: 如 果 对 一 个 数据 模型 中 的 一 些 条 目 (terms) 的 定 
义 ， 缺 乏 根 据 或 压根 不 存在 ， 那 么 此 时 极 有 可 能 对 这 些 条 目 产 生 多 种 
理解 。 如 果 数 据 模 型 中 的 一 则 业务 规则 规定 每 一 位 雇员 (Employee) 
必须 拥有 一 套 福 利 计 划 ， 同 时 又 将 “雇员 ”定义 为 左 基 生物 形式 这 样 一 
种 缺乏 现实 意义 的 表述 ， 那 么 我 可 能 认为 “ 座 员 ”包括 “工作 申请 人 ”， 
而 你 可 能 认为 不 包括 “工作 申请 人 (Job Applications) ”， 所 以 你 我 之 
间 必 将 有 一 位 是 错误 的 。 


2. Nee: 第 2 种 情形 出 现在 当 某 一 数据 超出 了 常规 的 取 值 ， 而 
我 们 又 希望 将 其 引入 特定 的 数据 记录 中 。 一 个 绕 开 数据 模型 严谨 性 
(rigor of data model) 的 老 把 戏 是 扩大 数据 模型 可 能 包含 的 数据 值 。 
例如 ， 出 于 某 种 考虑 ， 要 求 联系 人 必须 有 至 少 一 个 电话 号 码 ， 而 如 末 
要 添加 到 应 用 程序 的 联系 人 并 没有 电话 号 码 ， 那 么 某 位 程序 使 用 者 可 
能 为 该 联系 人 创建 诸如 “不 可 用 ”99” 或 其 他 假 电 话 号 码 ， 该 联系 人 最 
终 被 添加 进 了 应 用 程序 。 这 个 例子 中 ， 使 用 伪 数 据 将 一 位 没有 电话 号 
码 的 联系 人 添加 进 了 应 用 ， 从 而 违背 并 规避 了 我 们 最 初 制 是 的 业务 规 
则 。 


3. 模糊 或 缺失 的 标签 :阅读 一 个 数据 模型 类 似 于 阅读 一 本 书 ， 应 
该 有 正确 的 句子 结构 ， 动 词 是 句子 中 非常 重要 的 组 成 部 分 。 对 于 数据 
模型 ， 这 些 动词 用 来 描述 模型 中 一 些 概念 间 的 相互 天 联 。 以 “客户 
(Customer) ”和 “可 单 (Order) ”这 组 概念 为 例 ， 可 以 通过 动词 “J 
购 ”(place) 把 它们 相互 关联 ， 即 “一 位 客户 可 能 会 订购 一 个 或 多 个 订 
H» o 而 诸如 “联系 ”“ 有 ”等 模糊 的 动词 ， 或 者 缺少 动词 ， 将 降低 整个 数 
据 模型 的 精确 性 ， 正 如 我 们 不 能 准确 理解 一 个 句子 的 含义 一 样 。 


数据 模型 的 精确 性 还 源 于 使 用 了 一 组 标准 的 符号 集合 ， 那 家 加 油 
站 服务 员 为 我 绘制 的 区 通 图 使 用 了 标准 符号 ， 于 是 人 人 都 能 理解 。 我 
们 号 上 就 会 学 到 一 些 数据 模型 中 使 用 的 标准 符号 。 


2.3 ”使 用 数据 模型 


从 传统 的 角度 来 讲 ， 不 仅 要 求 对 一 个 新 的 应 用 进行 不 断 的 分 析 与 
设计 ， 以 明确 所 有 满足 该 项 目的 必 备 条 件 ， 还 应 该 对 现 有 数据 库 具 有 
完整 、 正 确 的 认识 ， 并 在 此 基础 上 完成 数据 模型 的 构建 。 由 于 模型 的 
精确 性 ， 数 据 模 型 还 可 以 被 用 于 以 下 几 种 情况 。 


理解 已 有 应 用 程序 。 数 据 模型 提供 了 一 个 简单 而 精确 的 视角 ， 用 
来 观察 某 个 应 用 程序 所 涉及 的 概念 。 我 们 可 以 通过 考察 一 个 现 有 应 用 
程序 的 数据 库 ， 并 根据 该 数据 库 结构 创建 出 一 个 数据 模型 。“ 逆 辐 工 
程 ” (reverse engineering) 这 一 专业 术语 ， 即 表示 根据 现 有 的 应 用 构建 
出 数据 模型 的 过 程 。 不 久 前 ， 一 家 制造 业 机 构 需 要 将 一 个 已 使 用 了 25 
年 的 应 用 系统 迁移 到 一 个 新 的 数据 库 平 台 ， 对 于 这 个 庞大 的 应 用 系 
统 ， 为 了 掌握 理解 它 的 结构 ， 我 们 将 数据 库 赣 辐 工 程 为 一 个 数据 模 


型 o 


风险 管理 。 通 过 数据 模型 可 以 获取 一 些 概念 及 概念 间 的 相互 作 
用 ， 并 且 这 些 概念 及 相互 作用 受到 程序 、 项 目 开 发 的 影响 。 对 一 个 现 
有 应 用 程序 进行 结构 性 添加 或 修改 将 产生 什么 影响 ”有 多 少 应 用 程序 
结构 需要 备份 ? 现在 有 很 多 机 构 购买 一 个 软件 后 会 再 对 其 进行 目 定 义 
人 和 修改。 影响 分 析 (impact analysis) 是 进行 风险 管理 的 一 种 方法 ， 借 助 
数据 模型 进行 影响 分 析 ， 来 明确 对 所 购买 的 软件 进行 结构 修改 会 产生 
什么 影响 。 


了 解 业务 。 开 展 一 个 大 型 项 目 开 发 的 必要 条 件 是 在 了 解 应 用 程序 
如 何 辅助 业务 开展 之 前 ， 你 最 好 先 去 了 解 相关 的 业务 流程 。 例 如 ， 在 
开发 订单 录入 系统 之 前 ， 得 先 了 解 订单 录入 的 处 理 过 程 。 我 最 欣赏 的 
一 句 话 源 自 威廉 :肯特 (William Kent) 1978 年 所 写 的 一 篇 名 为 “数据 与 
SEE” (Data and Reality) 的 文章 ， 文 中 当 肯 特 论述 到 创建 一 个 数据 库 
来 存储 图 书信 息 所 需要 的 步骤 时 ， 他 写 到 : 所 以 需要 再 次 强调 的 是 如 
果 计 划 创 建 一 个 图 书 数 据 库 ， 在 还 未 了 解 某 个 概念 的 准确 含义 之 前 ， 
最 好 在 所 有 用 户 中 达成 共识 ， 如 什么 是 “一 本 书 ”。 


培训 团队 成 员 。 当 新 成 员 想 要 尽快 跟 上 进度 或 开发 者 想 要 了 解 需 
求 时 ， 数 据 模型 可 以 作为 一 个 非常 有 效 的 曾 述 工具 。 一 位 新 人 无 论 何 
时 加 入 我 们 的 部 门 ， 我 都 会 花费 一 些 时 间 ， 通 过 一 系列 数据 模型 尽 可 
能 快 地 给 他 传授 一 些 相关 概念 。 


2.4 练习 2: 转变 非 信仰 着 


在 你 所 在 的 组 织 中 找到 一 位 数据 模型 的 非 信仰 者 ， 并 试图 转变 
他 。 你 都 磁 到 了 哪些 障碍 ? 你 是 否 说 服 了 他 们 ? 


V 数据 建 模 的 两 大 核心 价值 是 交流 性 及 精确 性 。 


V 无 论 是 建 模 中 ， 还 是 建 模 完 成 后 ， 都 需要 进行 交流 、 沟 通 。 


V 如 果 存 在 弱 定义 、 伪 数据 、 模 糊 或 缺失 标签 等 3 种 情况 ， 数 据 模型 的 


V 交流 性 和 精确 性 使 得 数据 模型 成 为 一 种 构建 应 用 程序 的 出 色 工 具 。 


V 数据 模型 还 可 以 被 应 用 于 理解 已 有 应 用 程序 、 了 解 业 务 、 执 行 影响 
分 析 和 培训 团队 成 员 。 


第 3 章 哪些 相机 设置 也 适用 于 数据 模型 
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相机 设置 
变焦 、 对 焦 、 定 时 右 、 滤 镜 
数据 模型 也 一 样 。 


本 章 将 数据 模型 与 相机 比较 ， 解 析 4 种 相机 上 的 设置 ， 它 们 完美 诠 
释 了 数据 模型 ， 理 解 这 些 设 置 对 数据 模型 的 影响 ， 将 有 助 于 增加 一 个 
应 用 项 目 成 功 的 几率 。 同 时 ， 本 章 还 对 比 了 3 个 层次 上 的 图 像 格 式 ， 从 
而 理解 概念 模型 、 逻 辑 模 型 和 物理 模型 。 


3.1 ”数据 模型 与 照相 机 


一 个 相机 上 可 以 使 用 很 多 设置 ， 来 确保 担 出 动人 的 画面 。 想 象 一 
下 ， 你 正 用 相机 瞄准 一 个 美丽 的 落日 场景 ， 即 使 面 对 同 一 场景 ， 如 采 
使 用 不 同 的 对 焦 、 定 时 做 或 变焦 设置 ， 那 么 你 可 能 也 会 拍 到 完全 不 同 
的 照片 。 例 如 ， 你 可 以 推 远 镜头 以 捕获 尽 可 能 多 的 落日 画面 ， 还 可 以 
拉 近 镜头 ， 将 画面 集中 在 一 位 在 落日 中 漫步 的 游客 的 号 上 ， 这 完全 取 
决 于 你 想 要 将 什么 呈现 在 照片 中 。 

变焦 、 对 焦 、 定 时 器 、 渡 镜 是 与 相机 有 关 的 4 种 设置 ， 它 们 都 可 以 


被 直接 变换 到 数据 模型 上 ， 如 图 3.1 所 示 ， 每 种 相机 设置 都 对 应 于 一 个 
数据 模型 的 特征 。 


定时 器 转换 为 时 间 


变焦 转换 为 范围 


对 焦 转换 为 抽象 
滤 镜 转换 为 功能 


图 3.1 相机 设置 向 数据 模型 的 变化 


通过 变焦 设 定 ， 可 以 允许 摄影 者 捕获 一 个 广阔 的 场景 而 忽略 一 些 
小 细 方 ， 或 者 捕获 一 个 强调 细 节 的 狭窄 范围 。 类 似 地 ， 对 数据 模型 的 
范围 (scope) 设置 可 以 改变 一 个 数据 模型 所 能 呈现 的 信息 量 大 小 。 相 
机 的 对 焦 设 置 可 以 决定 照 斤 中 的 景物 是 锐 化 的 (sharp) ， 还 是 模糊 的 

(blurry) 。 类 似 地 ， 对 模型 的 抽象 (abstract) 设置 则 可 以 使 用 诸如 
同类 (party) 、 事 件 (event) 等 通用 概念 来 “模糊 ” (blur) 概念 间 的 
区 别 。 定 时 器 可 以 用 来 设 定 一 个 实时 快门 ， 或 一 段 时 间 之 后 的 快门 。 
类 似 地 ， 对 数据 模型 的 时 间 (time) 设置 则 可 以 用 来 获取 一 个 当前 的 
视角 或 未 来 一 段 时 间 后 的 视角 。 滤 镜 设 置 可 以 用 来 调整 整个 画面 的 外 


观 ， 产 生 某 种 特定 的 视觉 效果 。 类 似 地 ， 数 据 模型 的 功能 (function) 
设置 则 可 以 用 来 将 模型 调整 到 业务 视 党 或 应 用 程序 视角 。 


同时 ， 不 能 忽略 图 像 类 型 的 重要 性 。 摄 影 校 样 (proof sheet) 允许 
在 一 张 纸 上 展示 所 有 的 图 像 ， 而 底片 为 Raw 格 式 的 图 像 ， 其 可 以 输出 
很 多 种 图 像 格式 ， 包 括 胶片 、 约 灯 片 或 数字 图 像 。 类 似 地 ， 相 同 的 信 
息 图 像 (information image) 能 够 存在 于 数据 模型 的 概念 、 逻 辑 、 物 理 
等 3 个 不 同 的 细节 层次 上 。 


哪 种 设置 适合 于 你 的 模型 ? 正如 落日 下 的 摄影 ， 这 取决 于 你 想 要 
捕获 什么 。 用 适当 的 模型 设置 匹配 你 的 模型 目标 ， 可 以 提升 数据 模型 
以 及 它 所 文 撑 的 应 用 项 目的 质量 。 


3.2 ”范围 


物 。 


E; 


数据 模型 和 相片 都 有 相应 的 边界 ， 边 界 决定 了 能 够 被 显示 的 事 
一 张 照片 可 以 捕捉 到 我 的 小 女儿 正 享受 冰淇淋 时 的 情景 (实际 
她 的 整个 面部 部 在 至 受 着 冰淇淋 ) ， 或 者 可 以 捕捉 到 我 女儿 及 其 


所 处 的 环境 ， 如 冰淇淋 店 。 类 似 地 ， 数 据 模 型 可 以 只 包含 索赔 过 程 
(claims processing) ， 或 者 还 可 以 宫 括 所 有 保险 业务 中 概念 。 典 型 的 
情况 下 ， 数 据 模型 范围 可 以 是 一 个 部 门 、 一 个 组 织 或 一 个 行业 。 


部 门 (工程 》。 最 常见 的 建 模 任 务 类 型 是 工程 级 范围 (project- 
level scope) ， 工 程 是 完成 软件 开发 任务 的 计划 ， 经 常 由 一 组 在 指 
定 日 期 之 前 可 交付 的 成 果 所 定义 。 例 如 ， 可 以 包括 销售 数据 集 市 
(sales data mart) 、 经 纪 人 交易 应 用 (broker trading 
application) 、 预 定 系统 (reservation system) 及 对 现 有 应 用 的 加 
强 。 
组 织 〈 应 用 程序 ) 。 应 用 是 一 种 大 型 的 、 集 中 组 织 的 计划 ， 其 中 
可 能 包含 多 个 工程 。 通 常 应 用 具有 起 始 日 期 ， 但 如 果 成 功 ， 则 没 
有 结束 日 期 。 应 用 可 能 是 非常 复杂 且 和 需要 长 期 模型 化 的 任务 。 例 
如 ， 可 以 包括 数据 仓库 (data warehouse) 、 操 作 数 据 存储 
(operational data store) 及 客户 关系 管理 系统 (customer 
relationship management system) 。 
行业 。 一 份 行业 计划 被 设计 ， 虽 在 获取 行业 中 的 一 切 ， 如 制造 业 
或 银行 业 。 很 多 行业 都 在 进行 大 量 的 工作 ， 致 力 于 共 宇 一 个 共用 
的 数据 模型 。 如 健康 卫生 和 电信 等 行业 联盟 ， 都 在 从 事 共 用 数据 


模型 结构 的 开发 ， 这 类 共用 结构 可 以 加 速 应 用 程序 开发 以 及 方便 
同行 业 中 不 同 组 织 间 的 信息 共享 。 


3.3 THR 


一 副 照片 可 以 是 模糊 或 清晰 的 。 类 似 于 如 何 对 照相 机 进行 对 焦 ， 
使 得 图 片 变 得 馈 化 或 模糊 ， 模 型 的 抽象 设置 允许 你 表现 “ 突 
化 ”(concrete 具 体 ) 或 “模糊 ” (generic 通 用 ) 的 概念 。 


通过 重 定义 和 对 模型 中 的 一 些 属性 、 实 体 、 关 系 进行 合并 ， 得 到 
一 些 通用 的 概念 ， 这 样 为 数据 模型 带 来 一 定 的 灵活 性 。 抽 和 象 是 指 去 除 
部 分 细节 而 保留 一 些 重要 的 属性 、 概 念 或 主题 的 必要 本 质 ， 从 而 扩展 
适用 性 ， 满 足 更 宽泛 的 应 用 需求 。 通 过 去 除 细节 ， 请 除 分 改 ， 改 变 我 
们 看 待 这 些 概念 或 主题 的 方式 ， 此 时 我 们 或 许可 以 看 到 那些 之 前 不 太 
了 明显， 长 至 未 曾 发 现 的 东西 。 例 如 ， 可 以 将 * 员 工交 顾客 ?抽象 为 一 个 
更 通用 的 “人 ?的 概念 ， 人 可 以 担任 不 同 的 角色 ， 员 工 、 顾 客 只 是 其 中 
的 两 种 ， 更 多 的 数据 模型 抽象 能 将 该 模型 变 得 更 宽泛 、 通 用 。 对 于 数 
据 模型 ， 概念 可 以 被 不 同 层 次 地 抽象 :;“ 业 务 云 ”“ 数 据 库 云 ”或 “地 面 
FF»。 


。 在 业务 云 中 。 在 这 一 级 别 的 抽象 中 ， 只 有 通用 的 概念 被 应 用 于 数 
据 模型 ， 业 务 云 模型 通过 使 用 诸如 人 (Person) 、 交 易 
(Transaction) 和 文档 (Document) 等 通用 概念 ， 隐 藏 许多 现实 
复杂 性 。 实 际 上 ， 当 使 用 业务 云 的 概念 时 ， 糖 果 公 司 和 保险 公司 
变 得 非常 相似 ， 倘 若 你 缺乏 对 某 一 业务 的 认识 ， 或 不 能 获取 到 一 
些 业务 文档 和 资料 ， 一 个 业务 云 中 的 模型 将 能 很 好 地 运作 起 来 。 
。 在 数据库 云 中 。 在 这 一 级 别 的 抽象 中 ， 只 有 通用 的 数据 库 
(database, DB) 概念 被 应 用 于 数据 模型 。 数 据 库 模 型 是 最 容易 


被 创建 的 ， 它 使 用 诸如 实体 (Entity) 、 对 象 (Object) 和 属性 
(Attribute) 等 数据 库 概 念 。 如 果 你 不 清楚 业务 如 何 开展 ， 而 又 
想 要 履 兰 所 有 行业 的 所 有 领域 ， 那 么 一 个 数据 库 云 中 的 模型 将 能 
很 好 地 运作 起 来 。 
在 地 面 上 。 这 类 模型 对 应 于 少量 的 业务 处 理 ， 并 使 用 尽 可 能 少 的 
数据 库 云 实体 ， 而 使 用 大 量 能 代表 具体 业务 术语 的 概念 。 比 如 数 
据 模型 得 花费 大 量 时 间 来 创建 学 生 、 课 程 、 教 师 等 3 个 概念 ， 并 人 允 
许 增 加 一 些 具体 的 值 来 帮助 理解 业务 处 理 、 解 决 数据 问题 。 


3.4 时间 


后 ， 


大 部 分 照相 机 具有 定时 右 功 能 ， 使 得 摄像 者 可 以 在 设 定 定时 器 
快 跑 并 把 他 目 己 也 拍摄 进 画 面 中 。 类 似 于 应 用 照相 机 定时 右 可 以 


担 摄 一 幅 当前 或 一 段 时 间 之 后 的 场景 ， 数 据 模型 的 时 间 设 置 允 许 将 一 
个 当前 或 未 来 的 视角 表现 在 模型 上 。 


一 个 数据 模型 可 以 表示 当前 的 业务 运转 ， 也 可 以 表示 未 来 一 段 时 


间 后 可 能 的 业务 状况 。 


当前 。 一 个 带 有 当前 设置 的 模型 可 以 获取 当前 业务 运作 的 信息 。 
即便 存在 一 些 陈旧 的 业务 规则 ， 它 们 也 得 出 现在 模型 中 ， 即 使 在 
不 久 的 将 来 这 些 规 则 要 被 修改 。 另 外 ， 如 采 一 家 企业 正 计 划 购 天 
男 一 家 公司 ， 或 出 售 一 家 公司 ， 或 者 正在 改变 经 营 种 类 ， 那 么 当 
前 视图 也 不 会 显示 任何 一 个 上 述 正 要 发 生 的 变化 ， 而 仅仅 只 能 
现 出 目前 的 状况 。 

未 来 。 一 个 带 有 未 来 设置 的 模型 可 以 表现 未 来 任意 一 个 时 间 阶 段 
的 业务 。 通 常 这 种 模型 是 一 个 理想 状态 下 的 视角 ， 无 论 过 去 了 1 
年 、5 年 ， 还 是 10 年 ， 未 来 设置 总 能 体现 该 组 织 的 发 展 方向 。 如 采 
一 个 模型 需要 文 持 某 个 组 织 的 发 展 规划 和 战略 布局 ， 那 么 设 定 一 
个 未 来 设置 将 是 其 首 迁 。 我 曾经 作为 负责 人 为 一 所 大 学 构建 模 
型 ， 由 于 有 大 量 的 应 用 迁移 要 在 一 年 内 完成 ， 所 以 这 个 模型 需要 
表现 出 一 年 以 后 的 情况 。 还 需 广 意 的 是 对 于 大 部 分 组 织 ， 如 有 果 需 
要 一 个 未 来 的 视角 ， 通 常 必 须 首 和 完 创建 一 个 当前 的 视角 作为 起 始 
点 ， 这 样 做 没有 什么 不 受 ， 正 如 一 位 摄影 者 可 以 对 一 个 场景 拍摄 


多 幅 照 请， 那么 一 位 数据 模型 的 创建 者 也 可 以 用 不 同 的 设置 去 创 
建 多 个 模型 。 


3.5 ”功能 


JE mie H oon TEL BA EY SA RET, BY LA 
用 不 同 颜色 的 滤 光 片 对 照片 进行 调整 ， 例 如 ， 让 照片 看 起 来 更 蓝 或 更 
绿 ， 与 相机 滤 镜 可 以 改变 场景 的 外 观 一 样 ， 数 据 模 型 的 功能 设置 则 人 允 
许 一 个 数据 模型 表现 为 业务 视角 或 功能 视角 。 我 们 正在 模型 化 一 个 业 
务 视角 下 的 世界 ， 还 古 应 用 程序 视角 下 的 世界 ? 有 时 它们 一 致 ， 但 有 
时 它们 有 很 大 的 差别 。 


。 业务 。 这 种 过 滤器 使 用 的 是 业务 术语 及 规则 ， 而 模型 呈现 与 应 用 
无 天 的 视角 ， 无 论 某 一 机 构 是 用 文件 想 存 储 信息 ， 还 是 使 用 最 有 
效 的 软件 系统 。 在 模型 中 ， 这 些 信息 将 会 被 一 些 业 务 概念 表示 。 
应 用 程序 。 这 种 过 滤器 使 用 的 是 应 用 程序 术语 及 规则 ， 是 用 应 用 
程序 的 观点 看 每 业务 运作 而 形成 的 视角 。 例 如 ， 应 用 程序 使 用 术 
语 “ 对 象 ?来 表示 “产品 ”， 则 产品 会 以 "对 象 ” 的 形式 出 现在 模型 
中 ， 而 且 和 是 以 应 用 程序 定义 术语 的 方式 进行 定义 ， 而 不 是 用 业务 
处 理 的 方式 进行 定义 的 。 


3.6 ”格式 


正如 一 台 照 相机 可 以 用 多 种 不 同 的 格式 获取 图 像 ， 数 据 模 型 的 格 


式 设 置 可 以 用 来 调整 模型 的 细节 水 平 ， 让 模型 呈现 出 很 宽 沁 、 高 层次 
的 概念 视图 (conceptual view) 或 呈现 出 能 反映 更 多 细节 的 逻辑 或 物理 
视图 (logical or physical view) 。 


概念 视图 。 通 常 当 一 组 照片 被 冲洗 时 ， 一 份 校 样 会 包含 每 一 幅 照 
片 的 缩 略图 ， 则 观察 者 可 以 用 一 张 相 纸 得 到 一 个 全 景 的 视角 ， 这 
里 的 全 景 视角 类 似 于 概念 数据 模型 (conceptual data model, 
CDM) 。 概 念 数据 模型 可 以 在 一 个 很 高 的 层次 上 表示 业务 ， 这 种 
很 宽泛 的 视图 仅 包 含 给 定 范围 内 的 一 些 基本 、 关 键 的 概念 。 这 里 
的 “基本 ”意味 着 在 一 天 的 交谈 中 一 些 概念 会 被 很 多 次 地 提 及 。“ 关 
键 ”意味 着 倘若 没有 这 些 概念 ， 部 门 、 公 司 、 行 业 会 被 极 大 地 改 
变 。 有 的 概念 是 所 有 组 织 通 用 的 ， 如 “顾客 “产品 * 和 “员工 ”"， 而 
有 的 概念 则 特定 于 某 一 行业 或 部 门 ， 如 保险 领域 中 的 “政策 ”， 或 
中 介 行 业 中 的 “交易 ”。 

逻辑 视图 。 在 数码 相机 问世 之 前 ， 一 卷 冲洗 过 的 胶片 可 以 得 到 一 
组 底片 ， 这 些 底片 可 以 用 来 很 好 地 观察 所 拍 相片 ， 这 里 底片 类 似 
于 逻辑 数据 模型 (logical data model, LDM) ° ZERERA 
述 了 一 份 详 细 的 业务 解决 方案 ， 这 使 得 建 模 者 不 用 创建 与 软 硬 件 
实现 有 关 的 复杂 数据 模型 ， 就 能 掌握 相应 的 业务 需求 

物理 视图 。 虽然 底 片 是 一 种 很 好 的 观察 相片 的 视角 ， 但 它 其 实 并 
不 实用 。 例 如 ， 你 不 太 可 能 将 底片 置 于 相框 或 相册 中 拿 去 与 朋友 


分 享 ， 你 应 该 转换 或 “实例 化 ” (instantiate) 底片 为 照片 、 约 灯 片 
或 数字 图 像 。 相 似 的 ， 逻 辑 数 据 模型 需要 被 修改 成 更 实用 的 物理 
数据 模型 (physical data model, PDM) 。 它 是 逻辑 数据 模型 的 化 
身 (incarnation) 或 实例 化 (instantiate) ， 类 似 于 照片 是 底片 的 
化 身 ， 物 理 数据 模型 表示 详细 的 技术 解决 方案 ， 是 对 特定 环境 的 
优化 (诸如 特定 的 软件 或 硬件 环境 ) 。 物 理 数 据 模 型 是 在 某 种 特 
定 环境 下 ， 对 逻辑 模型 执行 力 的 修改 、 增 强 ， 在 该 环境 中 数据 将 
被 创建 、 维 护 和 访问 。 


37 & 43 。 选择 正确 的 设置 


在 下 列 列 表 中 ， 为 每 种 情形 选 出 最 适当 的 设置 ， 参 考 答案 在 书 的 


3. 获取 一 份 关于 新 的 销售 数据 集 市 的 详细 需求 (数据 集 市 是 为 了 
满足 一 些 特 定 用 户 需求 而 设计 的 一 种 数据 仓库 ) 。 


V 照相 机 上 有 4 种 设置 ， 变 焦 、 对 焦 、 定 时 器 、 滤 镜 ， 它 们 都 可 以 被 直 : 
接 转换 到 数据 模型 上 。 变 焦 可 以 转换 为 数据 模型 的 范围 。 对 焦 可 以 转换 为 
数据 模型 的 抽象 。 定 时 器 转换 为 时 间 设 置 ， 用 来 决定 数据 模型 获取 当前 的 
视图 ， 还 是 未 来 的 视图 。 过 滤器 转换 为 功能 设置 ， 用 来 决定 数据 模型 获取 
的 是 业务 视角 ， 还 是 应 用 程序 视角 。 


V 用 适当 的 模型 设置 匹配 建立 模型 的 目标 ， 可 以 提升 数据 模型 以 及 它 
所 文 撑 的 应 用 项 目的 质量 。 


V 不 要 忘记 关于 图 像 格式 的 可 选项 ! 人 们 更 喜欢 去 看 一 份 校 样 (概念 
数据 模型 ，、 底 片 ( 风 辑 数据 模型 ，， 还 是 图 片 〈 物 理 数据 模型 ) ? 


第 2 部 分 数据 模型 要 素 


And then each Customer can buy many Products, and 
they lived happily ever af tec 


第 2 部 分 将 解释 数据 模型 中 所 使 用 的 符号 及 文本 。 第 4 章 解释 实 
体 ， 第 5 章 则 关于 属性 ， 第 6 章 讨论 关系 ， 第 7 章 说 明 键 。 当 完成 了 本 部 
分 的 学 习 ， 你 将 可 以 读 慌 任意 规模 、 复 杂 度 的 数据 模型 。 


第 4 章 介 绍 了 实体 (entity) 的 定义 并 讨论 了 不 同 种 类 的 实体 ， 实 
体 实例 也 将 于 本 章 介绍 。 同 时 ， 对 实体 上 存在 的 3 种 层次 一 一 概念 、 逻 
辑 、 物 理 也 做 了 相应 的 说 明 。 进 一 步 地 还 介绍 了 与 弱 实 体 (weak 
entity) 相关 的 概念 。 


第 5 章 介绍 了 属性 的 定义 并 讨论 了 域 的 概念 ， 而 且 还 给 出 了 3 种 不 
同 域 类 型 的 实例 。 


第 6 草 介 绍 了 规则 和 关系 的 定义 ， 数 据 规 则 有 别 于 行为 规则 。 男 
外 ， 基 数 和 标签 也 将 会 被 曾 述 。 由 此 使 得 能 像 阅读 小 说 那样 轻松 地 读 


懂 任 何 数据 模型 。 递 归 关 系 (recursive relationships) 、 子 类 型 
(subtyping) 等 关系 类 型 也 将 被 讨论 。 


第 7 章 介绍 了 键 的 定义 ， 并 对 候选 键 、 主 键 、 备 用 键 等 术语 加 以 区 
分 ， 而 且 还 将 介绍 代理 键 、 外 键 的 定义 ， 并 对 它们 的 重要 性 加 以 解 
析 。 


有 趣 的 概念 


谁 、 什 么 、 何 时 、 何 地 、 为 何 及 如 何 
实体 比比 家 是 


当 我 在 教室 中 来 回 践 步 ， 想 看 看 十 否 有 学 生 会 有 疑问 时 ， 我 注意 
到 坐 在 最 后 一 排 的 一 名 同学 已 经 完成 了 练习 ， 我 走 到 她 的 座位 券 ， 只 
看 见 她 在 纸 上 画 了 几 个 矩形 框 ， 其 中 有 一 个 大 点 的 矩形 框 里 面 写 着 “ 生 
产 ”， 我 询问 她 如 何 理解 所 定义 的 “生产 ”， 她 回答 说 : “生产 是 一 个 将 
原材料 加 工 成 最 终 产 品 的 过 程 ， 所 有 的 生产 步 又 都 被 包含 在 这 个 矩形 
HER” ° 


事实 上 ， 数 据 模型 中 的 矩形 ， 即 实体 ， 不 是 被 设计 用 来 表示 或 包 
含 处 理 的 。 相 反 ， 实 体 是 用 来 表示 在 处 理 中 所 使 用 到 的 一 些 概念 。 那 
名 同学 所 设计 的 模型 里 的 "生产" 实体， 事实 上 可 以 被 最 终 转化 成 其 他 
的 几 个 实体 ， 包 括 “ 原 材料 “最 终 货物 “机 器 ”生产 计划 "等 。 


本 章 定 义 了 实体 的 概念 ， 并 讨论 了 实体 的 不 同 种 类 ( 谁 、 什 么 、 
何 时 、 何 地 、 为何 及 如 何 ) ， 同 时 ， 对 实体 的 3 个 层次 一 概念 、 逻 辑 、 
物理 加 以 解释 ， 进 一 步 地 ， 还 介绍 了 与 弱 实 体 相 关 的 概念 。 


4.1 实体 的 说 明 


一 个 实体 表示 的 是 对 于 业务 非常 重要 或 值得 获取 的 事物 及 与 之 相 
天 的 信息 集合 。 每 个 实体 都 由 一 个 名 词 或 名 词 词组 定义 ， 并 符合 六 大 
种 类 之 一 : 谁 、 什 么 、 何 时 、 何 地 、 为 何 及 如 何 。 表 4.1 为 实体 种 类 的 
定义 及 相应 的 实例 。 


表 4.1 实体 信息 


Employee ` Patient ` Player ` 


上 有 益 的 人 或 组 织 ， 即 “业务 中 ， 谁 
通常 人 或 组 织 与 某 一 角色 关 
“顾客 ”或 “供应 商 ” 


Suspect ` Customer ` Vendor ` 


Student ` Passenger » Competitor ` 


Author 


对 企业 有 益 的 产品 或 服务 ， 通 常 可 以 理 | Product ` Service ` Raw Material ` 


解 为 : 组织 会 把 什么 保留 在 它 的 业务 Finished Good ` Course ` Song ` 


内 ， 即 对 业务 而 言 重要 的 东西 是 什么 Photograph ` Title 


Time ` Date ` Month ` Quarter ` 


对 企业 有 益 的 日 程 或 时 间 间 隔 ， 
何 时 运作 


Year ` Semester ` Fiscal Period ` 


Minute 


对 企业 有 益 的 位 置 ， 位 置 可 以 是 一 个 实 
际 的 地 点 ， 也 可 以 是 电子 化 的 虚拟 
场所 ， 即 业务 在 哪 开 忆 


Mailing Address、Distribution 
Point ` Website URL ` IP Address 


Order ` Return ` Complaint ` 
对 企业 有 益 的 事件 或 交易 ， 这 些 事 件 Withdrawal ` Deposit ` 
证 业务 的 运转 ， 即 业务 运转 的 原 Compliment ` Inquiry ` Trade ` 


Claim 


对 企业 有 益 的 事件 的 文档 ， 文 档 用 来 1 Invoice ` Contract ` Agreement ` 
录 事 件 ， 如 "采购 订单 ”里 记录 了 一 次 订购 |Purchase Order ` Speeding Ticket ` 


事件 ， 即 在 业务 中 事件 如 何 被 跟踪 Packing Slip ` Trade Confirmation 


实体 实例 是 一 个 具体 实体 的 呈现 或 者 说 是 实体 的 值 。 试 想 将 一 
电子 表格 当 作 一 个 实体 ， 其 中 列 标题 代表 实体 应 该 记录 的 一 些 信 息 ， 
每 个 电子 表格 行 包含 的 实际 值 则 为 一 个 实体 实例 。 人 例如， 实体“ 顾 
客 ” 可 以 被 一 些 如 Bob、Joe、Jane 等 具体 的 姓名 实例 化 ， 实 体 “ 账 户 ? 则 
可 能 有 诸如 Bob 的 文 标 账户 、Bob 的 储蓄 账户 、Joe 的 经 纪 人 账户 等 实 
例 。 


4.2 ”实体 类 型 


数据 模型 之 美 在 于 你 可 以 根据 不 同 的 受众 把 相同 的 信息 以 不 同 的 
细 区 水 平 至 现 出 来 。 上 一 章 介绍 了 3 种 细节 水 平 : 概念 、 逻 辑 、 物 理 。 
实体 是 所 有 3 个 细节 水 平 的 组 成 部 分 。 


实体 可 以 在 概念 、 逮 辑 和 物理 3 种 层次 上 被 描述 。 概 念 意味 痢 高 层 
次 的 业务 流程 的 解决 方案 或 应 用 程序 频 渗 定 义 的 范围 和 重要 术语 。 罗 
辑 意 味 着 业务 流程 的 详细 解决 方案 或 应 用 程序 。 物 理 意味 着 应 用 程序 
详细 的 技术 解决 方案 。 


那些 基本 、 关 键 的 业务 信息 ， 才 能 与 实体 的 概念 层 相 天， 而 什么 
征 基本 且 关 键 的 信息 ， 这 很 大 程度 上 取决 于 所 关注 的 范围 。 在 一 个 普 
允 的 范围 内 ， 有 一 些 最 肖 见 的 共识 概念 ， 例 如 , A” a a 
工 ”。 如果 将 范围 缩小 一 点 ， 一 个 给 定 的 行业 可 能 会 产生 一 些 特定 的 概 
念 ， 对 于 广告 行业 , “宣传 "可 以 是 一 个 有 效 的 概念 ， 但 对 于 其 他 行业 
则 不 尽 然 。 


在 逻辑 层 上 描述 的 实体 ， 使 用 了 比 概念 层 更 多 的 细节 来 描述 业 
务 。 通 常 ， 一 个 概念 实体 可 以 被 表示 成 多 个 逻辑 数据 模型 实体 ， 逻 辑 
实体 中 包含 的 属性 (attributes) 将 在 第 5 章 讨 论 。 


在 物理 层 上 ， 实 体 对 应 于 某 种 特定 技术 的 对 象 。 例 如 ， 关 系 型 数 
据 库 管 理 系统 RDBMS 中 的 数据 库 表 ， 又 如 NoSQL 数 据 库 MongoDB 中 
的 集合 (collection) 。 物 理 层 与 逻辑 层 非常 相似 ， 但 是 往往 需要 一 些 
技术 在 数据 库 执行 性 能 及 数据 存储 上 找到 相应 的 解决 方案 。 物 理 实体 


还 包含 一 些 与 特定 数据 库 相 关 的 信息 ， 例 如 ， 属 性 的 格式 或 长 度 〈 作 
者 的 姓氏 ， 长 度 50 个 字符 ) ， 或 者 属性 是 否 需要 被 赋值 (作者 税 号 不 
为 衬 ， 故 需要 赋值 ， 作 者 生日 可 为 空 ， 故 可 以 不 赋值 ) 。 


在 关系 型 数据 库 (RDBMS) 中 ， 物 理 实 体 对 应 于 数据 库 表 或 视 
图 。 而 在 NoSQL 数 据 库 中 ， 物 理 实体 的 转换 取决 于 底层 技术 ， 例 如 ， 
在 一 个 基于 文档 的 数据 库 MongoDB 中 ， 实 体 对 应 于 集合 
(collection) ° 而 通用 术语 结构 (structure) 指 的 是 底层 数据 库 组 件 ， 
与 具体 的 RDBMS 或 NoSQL 数 据 库 解决 方案 无 关 。 


图 4.1 所 示 为 几 个 与 冰淇淋 店 有 关 的 实体 ， 每 个 实体 用 包含 实体 名 
的 矩形 框 表示 。 


冰淇淋 口味 


冰淇淋 大 小 


冰淇淋 订单 | 


图 4.1 实体 的 表示 


需要 注意 的 是 有 两 种 类 型 的 矩形 框 ， 例 如 ， 冰 淇 溧 口味、 冰淇淋 
大 小 那样 的 直角 和 矩形 框 ， 还 有 如 冰淇淋 订单 那样 的 圆 角 和 矩形 框 。 这 里 
并 不 打算 用 过 时 的 建 模 术 语 来 区 分 两 种 矩形 框 ， 只 需 明 确 对 于 大 多 数 
建 模 工 具 来 说 ， 直 角 框 表示 强 实体 ， 圆 角 框 表示 弱 实 体 。 


强 实体 可 以 独立 存在 ， 用 来 表示 相对 独立 的 人 、 事 或 地 点 。 例 
如 ， 为 了 检索 某 位 特定 顾客 的 信息 ， 可 以 在 数据 库 中 使 用 顾客 号 进行 


查找 。“ 这 是 Bob， 顾 客 号 为 123”。 巧克力 风味 的 冰淇淋 可 以 用 C 进 行 
检索 ， 冰 淇 淋 大 小 为 两 是 的 信息 可 以 用 数字 2 进行 检索 。 


弱 实 体 至 少 依赖 于 一 个 其 他 的 实体 ， 这 意味 着 如 果 不 引 用 其 他 实 
体 的 实例 ， 头 无 法 检索 弱 实 体 的 实例 ， 例 如 ， 冰 诺 淋 订单 可 以 由 冰 诺 
淋 口 味 或 冰淇淋 大 小 ， 再 结合 冰淇淋 订单 中 的 某 些 内 容 〈 如 序号 ) 进 
行 检索 。 


数据 模型 是 一 种 交流 工具 。 理 解 强 实体 、 弱 实体 间 的 差别 将 有 助 
于 我 们 理解 实体 间 的 关系 和 依赖 。 例 如 ， 在 阅读 数据 模型 时 发 现 冰 湛 
淋 订 单 是 依赖 于 冰 洪 淋 口 味 的 弱 实 体 ， 于 古 在 软件 开发 过 程 中 就 应 该 
确保 冰淇淋 口味 信息 先 于 订单 提交 被 添加 ， 即 提交 一 份 巧 克 力 冰淇淋 
订单 之 前 ， 作 为 冰淇淋 口味 的 “巧克力 ”需要 在 软件 系统 中 可 用 。 


43 ”练习 4: 定义 概念 


列举 3 个 你 所 在 机 构 的 概念 。 机 构 中 对 这 3 个 概念 是 否 有 唯一 共识 
的 定义 ? 如 采 不 是 ， 为 什么 ? 你 是 否 可 以 为 每 一 条 给 出 一 个 单独 的 定 


V 一 个 实体 表示 的 是 对 于 业务 非常 重要 或 值得 获取 的 事物 及 与 之 相关 
的 信息 集合 。 实 体 应 该 符合 六 大 种 类 之 一 : 谁 、 什 么 、 何 时 、 何 地 、 为 何 
及 如 何 。 


V 实体 由 名 词 或 名 词 词组 定义 。 


V 实体 实例 是 一 个 具体 实体 的 呈现 或 者 说 是 实体 的 值 。 


V 实体 可 以 存在 于 概念 、 逻 辑 、 物 理 等 3 种 细节 水 平 上 。 


V 实体 可 分 为 强 实体 和 弱 实 体 。 


电子 表格 由 各 列 构成 ， 
属性 类 似 于 列 ， 
模型 无 处 不 在 。 


本 对 介绍 属性 的 概念 及 属性 可 存在 的 3 个 不 同 层次 一 概念 、 逻 辑 、 
物理 。 域 及 不 同类 型 的 域 也 将 被 讨论 。 


5.1 属性 的 解释 


属性 是 一 则 相对 独立 的 信息 ， 其 值 用 以 识别 、 摘 述 、 评 估 实 体 实 
例 。 例 如 ， 属 性 “索赔 号 ”可 以 识别 每 个 索赔 ， 属 性 “学 生 的 姓氏 ”用 来 
描述 学 生 。 属 性 “销售 总 额 * 用 来 评估 交易 中 获取 的 财政 收入 。 


以 电子 示 格 为 例 ， 电 子 表格 中 的 列 标题 就 是 属性 。 每 个 列 标题 下 
方 一 个 个 单元 格 用 来 存储 相应 属性 的 值 。 我 们 可 以 将 电子 表格 中 的 列 
标题 、 表 单 中 的 域 、 报 表 中 的 标签 都 理解 为 属性 。“ 冰 诺 淋 风味 名 关 冰 
淇 淋 天 小 代码 ”是 关于 冰淇淋 店 的 属性 ， 而 "公司 名 ”电话 号 码 ? 征 天 于 
名 所 的 属性 。 


5.2 ”属性 类 型 


与 实体 类 似 ， 属 性 也 可 以 在 概念 、 逻 辑 、 物 理 等 3 个 层次 上 加 以 描 
述 。 概 念 级 属性 必须 是 对 业务 起 着 基本 且 又 关键 影响 的 概念 。 一 般 情 
况 下 ， 属 性 不 被 当 作 概念 ， 但 这 取决 于 业务 需求 ， 允 许 例外 。 以 前 ， 
我 曾 为 一 家 通信 公司 提供 数据 建 模 服务 ， 在 其 他 应 用 中 电话 号 码 通 常 
被 视 为 属性 ， 但 它 对 于 这 家 通信 公司 的 业务 却 非常 重要 ， 所 以 电话 号 
码 被 表示 成 了 概念 数据 模型 中 的 概念 。 


逻辑 模型 中 的 属性 则 描述 的 是 业务 特征 。 每 个 属性 对 于 业务 解决 
方案 都 有 不 同 程度 的 贡献 ， 并 旦 与 任何 软 、 硬 件 技术 无 天 。 例 如 ,“ 冰 
淇 淋 口味 名 ”就 是 一 则 逻辑 级 属性 ， 因 为 它 对 业务 解决 方案 有 重要 意 
X, 而且 并 不 取决 于 到 底 存储 在 纸 质 文件 中 ， 还 是 存储 在 高 速 数 据 库 
中 。 与 物理 数据 模型 对 应 的 属性 可 以 被 理解 为 一 个 物理 “ 容 顺 ”， 用 来 
存储 数据 ， 属 性 “冰淇淋 口味 名 ”在 RDBMS 中 可 以 被 表示 为 ICECRM 卖 
下 HYICE_CRM_FLVR NAM 列 ， 或 者 在 MongoDB 数 据 库 中 被 表示 为 


IceCream 集 合 中 的 字段 IceCreamFlavorName。 


需要 注意 的 是 本 书 中 为 了 保持 文字 上 的 一 致 性 ， 我 们 使 用 的 是 “ 属 
性 ”(attribute) 。 但 在 实际 工作 中 ， 我 则 建议 使 用 那些 更 容易 让 用 户 
接纳 的 术语 。 例 如 ， 有 的 业务 分 析 师 可 能 更 倾向 于 使 用 特征 
(property) 或 标签 (label) ， 而 有 的 数据 库 管 理 员 或 许 更 习惯 使 用 列 
(column) 或 字段 (field) 。 


5.3” 域 的 解释 


域 是 某 一 属性 所 有 可 能 取 值 的 集合 。 域 中 往往 还 包含 一 组 验证 标 
准 ， 使 得 域 可 以 被 多 个 属性 使 用 。 例 如 ,， “日 期 * 域 中 包括 所 有 的 合法 
日 期 ， 它 可 以 被 应 用 于 以 下 这 些 属性 。 


。 雇员 入 职 日 期 
订单 输入 日 期 
索赔 提交 日 期 
课程 开始 日 期 


如 采 属 性 与 域 相关 联 ， 那 么 该 属性 的 取 值 绝对 不 允许 超出 该 域 ， 
域 中 的 值 可 以 由 一 组 特定 的 数据 列表 指定 ， 也 允许 由 一 组 规则 指定 。 
例如 , “员工 性 别 * 可 以 由 取 值 为 “ 男 ” 和 “ 女 ” 的 域 限 定 。“ 员 工 入 职 日 
期 ?可 以 由 一 组 规则 限定 ， 如 取 规 则 为 “合法 日 期 >”， 则 其 可 能 取 值 如 
下 


e February 15,2005 
e 25 January 1910 

e 20150410 

e March 10",2050 


由 于 员工 入 职 日 期 应 该 被 设 定 为 一 个 有 效 的 日 期 ， 故 February 
30th 被 排除 。 在 此 基础 上 ， 还 可 以 用 一 组 附加 规则 来 限定 其 域 。 例 
如 ， 限 定员 工 入 职 日 期 的 域 为 早 于 今天 ， 这 样 March 10 中 ,2050 被 排 
除 ， 又 如 果 限 定 其 格式 为 YYYYMMDD (年 、 月 、 日 串联 日 期 格 


式 ) ， 除 了 20150410 之 外 其 他 的 都 应 被 排除 。 还 可 以 使 用 精简 的 数据 
合 来 限定 员工 入 职 日 期 的 域 ， 即 规定 该 日 期 必须 符合 星期 一 、 星 期 


` 星期 三 、 星 期 四 、 星 期 五 中 的 一 个 〈 典 型 的 工作 日 ) 。 


|1 AÈ 


在 名 片 实 例 中 , “联系 人 姓名 ?可 能 包含 数 千 种 ， 甚 至 数 百 万 种 取 
值 ， 如 图 1.2 给 出 的 4 张 名 片 ， 其 姓名 为 : 


e Steve Hoberman 
e Steve 

e Jenn 

e Bill Smith 


e Jon Smith 


姓名 域 应 该 需要 稍 作 精 向， 有 必要 明确 此 域 的 域 值 是 否 必 须 由 姓 
和 名 两 部 分 构成 ， 如 Steve Hoberman， 还 是 可 以 仅 包含 名 ， 如 Steve。 
该 域 可 以 包含 公司 名 吗 ， 如 IBM? 这 个 域 是 否 允 许 出 现 数字 ， 而 不 仅 
仅 是 字母 ， 如 来 自 电 影星 际 大 战 的 名 字 R2D2? 这 个 域 是 否 可 以 出 现 一 
些 特 殊 的 字符 ， 如 O(+>?O(+>， 该 字符 串 是 音乐 王子 在 1993 年 把 他 的 
名 字 变 成 这 种 不 能 发 音 的 “ 爱 的 符号 ”。 


以 下 为 3 种 基本 的 域 类 型 。 


D 格式 域 将 数据 指定 为 数据 库 中 的 标准 类 型 ， 如 整 型 
(Integer) ` FFÆ! (Character (30) ) 、 日 期 (Date) 等 都 是 格式 
域 。 


D 列表 域 类 似 于 一 个 下 拉 列 表 ， 它 由 一 个 可 选 的 有 限 值 的 集合 组 
成 ， 列 表 域 是 格式 域 的 精简 ， 如 “订单 状态 代码 ”的 格式 域 可 以 被 置 为 
Character(10)， 在 此 基础 上 该 域 可 以 由 一 个 (Open ` Shipped ` 
Closed ` Returned) 列表 域 进一步 精简 。 


O 范围 域 的 设置 要 求 取 值 介 于 最 小 值 与 最 大 值 之 间 ， 例 如 ,“ 订 
单 交 付 日 期 ?必须 为 从 今天 到 未 来 3 个 月 中 的 菜 天 。 与 列表 域 类 似 ， 苑 
围 域 也 是 格式 域 的 精简 。 


基于 以 下 几 个 原因 ， 域 是 非常 有 用 的 。 


O 插入 数据 前 ， 通 过 域 的 检查 来 提高 数据 质量 。 这 是 域 存 在 的 主 
要 原因 ， 通 过 限定 属性 的 可 能 取 值 来 降低 脏 数据 进入 数据 库 的 可 能 
性 。 例 如 ， 每 一 个 表示 金额 的 属性 被 设置 为 “数量 域 "， 该 域 要 求 数字 
的 长 度 上 限 为 15 且 包括 小 数 点 后 的 两 位 ， 显 然 这 是 表示 货币 数额 很 好 
的 一 种 方法 ,，“ 销 售 忌 额 * 帮 被 设置 为 “数量 域 "， 则 不 允许 如 R2D2 这 样 
的 值 被 添加 。 


@ 数据 模型 的 交流 性 更 强 。 当 我 们 在 数据 模型 上 设置 了 域 ， 怠 意 
味 痢 数据 模型 的 一 个 属性 必须 具备 一 个 特定 域 的 特征 ， 这 样 数据 模型 
忠 变 成 更 容易 被 理解 的 交流 工具 。 例 如 ， 我 们 可 以 让 “销售 忌 额 *% 兆 销 
售 额 * 标 价 销售 人 额 *3 个 属性 都 可 以 共 至 一 个 “数量 域 "*， 进 而 共 至 域 的 
特征 ， 它 们 的 取 值 都 被 限定 为 “货币 ”。 


@ 使 得 新 建 模 型 、 维 护 现 有 模型 变 得 更 有 效率 。 当 一 位 模型 构建 
师 开始 一 项 新 工程 时 ， 可 以 使 用 一 组 标准 域 来 节省 时 间 ， 而 无 需 重新 


创建 。 例 如 ， 所 有 与 数量 有 天 的 属性 ， 都 可 以 同时 与 数量 域 关 联 ， 这 
样 可 以 极 大 市 省 分 析 、 设 计时 间 。 


5.4 #5: 设置 域 


为 下 列 3 个 属性 设置 适当 的 域 ? 


。 电子 邮件 地 址 
。 销售 总 额 
。 国家 代码 


VY 对 业务 而 言 ， 属 性 是 非常 重要 性 的 特征 ， 其 值 用 以 识别 、 描 述 、 评 
估 实 体 实 例 。 


vV 域 中 往往 包含 一 组 验证 标准 ， 使 得 域 可 以 被 多 个 属性 应 用 。 


V 域 的 不 同类 型 包括 : 格式 域 、 列 表 域 、 范 围 域 。 


ANS 


第 6 章 关系 


规则 无 处 不 在 ， 
RA AS 
并 把 一 个 个 情节 联系 起 来 。 


本 章 介 绍 了 规则 和 关系 的 定义 ， 以 及 关系 存在 的 3 个 层次 ， 概 念 、 
逻辑 、 物 理 。 数 据 规 则 有 别 于 行为 规则 。 基 数 及 标签 也 将 在 本 章 曾 
述 。 学 习 完 本 章 你 可 以 像 读 书 那样 读 懂 任何 数据 模型 。 递 归 天 系 

(recursive relationships) 和 子 类 型 (subtyping) 等 关系 类 型 也 将 被 讨 


论 。 


6.1 关系 的 解释 


通常 我 们 对 规则 的 理解 是 在 特定 情形 下 如 何 行为 的 规定 和 指示 。 
以 下 列举 了 你 应 该 非常 熟悉 的 天 于 规则 的 例子 。 


。 在 你 外 出 玩 页 之 前 ， 房 间 必须 被 整理 干净 。 
© 如 果 击 球 手 3 次 挥 棱 不 中 ， 则 三 振 出 局 ， 轮 到 下 一 位 击 球 手 回合 。 
。 限 速 每 小 时 55 英 里 (1 英里 x1.61 千 米 ) ° 


数据 模型 中 的 规则 即 为 关系 ， 关 系 被 表示 成 一 条 连接 两 个 实体 的 
线段 ， 用 来 说 明 实 体 间 的 规则 或 导航 路 径 。 如 果 两 个 实体 分 别 
7y“Employee” (MI) 和 “Department”( 部 门 ) ， 则 关系 可 以 描述 的 
规则 有 “每 位 员工 必须 服务 于 一 个 部 门 ”一 个 部 门 可 以 拥有 一 位 或 多 位 


员工 ” G 


6.2 关系 的 类 型 


规则 可 以 是 数据 规则 ， 也 可 以 是 行为 规则 。 数 据 规 则 指示 数据 间 
如 何 关 联 ， 行 为 规则 指示 当 属 性 包含 有 某 特 定 值 时 ， 需 要 采取 什么 操 
作 ， 下 面 首先 介绍 数据 规则 。 


存在 两 种 类 型 的 数据 规则 ， 结 构 完 整 型 (structural integrity, SI) 
和 参照 完整 型 (referential integrity, RI) 。 结 构 规 则 〈 又 被 称 为 基数 
规则 ) 定义 了 参与 某 个 关系 的 实体 实例 的 数量 ， 例 如 : 


每 种 产品 可 以 出 现在 一 个 或 多 个 订单 行 上 。 
每 个 订单 行 上 有 且 仅 有 一 则 产品 。 
每 位 学 生 必 须 有 了 唯一 的 学 号 。 


免费 样 章 到 此 结束 。 
喜欢 这 本 书 ? 


